「哄女友挑战」上线爆火，两天烧掉10亿tokenAI新浪财经|泡泡短信测压在线_在线平台

这款哄哄模拟器，由AI扮演生气的男/女朋友，限定对话次数训练，帮助你提高获得原谅的水平。

不同预设场景难度也不同，共有15轮对话机会，哄对了原谅值上涨，达到100%算成功，实测3颗星的AI要哄好也是要费一番功夫的。

作者在苹果应用商店介绍中写到，开发灵感正是在生活中真的和对象吵架，好不容易哄好，于是想在AI的帮助下多练习。

半夜涌入超出承受能力的流量，烧掉了大模型八千万token，随时倒闭。

也是万万没想到，“AI教人谈恋爱”比“和AI谈恋爱”先火了，而且不是孤例。

这款PlugAI更直球一些，把约会App上和真人的聊天记录截图发过去，AI就能指导你，如何不把天聊死。

还有网友发现这款App正在寻求收购，喊价350万美元（约2500万元人民币）。

人类，真的这么需要AI帮忙谈恋爱？

约会助手大战虚拟女友

既然“哄哄模拟器”和“约会助手”的玩法刚好是相对的，那为什么不让他们来一场大比拼呢？

哄哄模拟器中一共预置了十个场景，这里我们选择了五星难度的“聚会晚归没告诉女友，导致她很担心”的故事（事故）。

游戏的机制是需要玩家主动开启对话，所以我们先人工开启话题，结果18%的原谅度直接降到了4%。

不过由于“女友”受到事件设定的影响比较大，导致*句话看上去不那么自然。

在PlugAI生成了后续的对话内容后，*句话成功地把原谅值拉回了14%，接下来就看看它能不能在剩余的13次对话中完成目标。

接下来的对话还算是能让“女友”比较满意，但毕竟这个“女友”不是真人，游戏突然陷入了死循环，PlugAI的回复让“女友”一直在重复一句相同的话。

（所以为了游戏能够继续进行，这里我们需要人工介入一下。）

人工介入的内容大概是，先向“女友”保证自己说到做到，然后提出去外面吃饭，并选择了寿司，“女友”欣然同意，原谅度来到了58%。

接下来，Plug决定要开始输出了：

结果“女友”看上去还是挺满意的，原谅度已经来到了69%，这时还剩下7轮对话机会。

不过输出这一轮之后，话题突然就离不开吃了……

而且由于PlugAI的主要受众是西方人，所以会出现“你会不会用筷子”这样的回复。

反复试验之后，我们挑选了这样的两句，没想到效果还挺好的。

接下来的几轮对话都是，依然是围绕着“吃”展开，不过这位“女友”还是比较认可的。

终于，经历了六次AI回复和三轮人工辅助，在还剩4句话的时候，PlugAI挑战虚拟女友成功。

而除了应对女友的灵魂拷问，PlugAI还可以帮人们“没话找话”，开启新的话题。

滑动条在左侧时，得到的是一些谐音梗和土味情话；如果拖到右侧，则会有一些不可描述的内容，这里就不展示了。

从他们的对话，特别是PlugAI的发言中可以看出，这些AI生成的内容仍然带有一定的“AI感”，即让人感觉是用数据训练出的结果，而不是真正地理解了人类在恋爱环境中的想法和需要；

同时，“哄哄模拟器”中，“女友”的人设看上去也远没有真人般丰富真实。

GPT套壳也能成功

两个爆款App还有一个共同特点，团队规模不大就能创造神话。

除此之外他还创办了AI绘画平台6pen，在更早的移动互联网时代也有不少作品，属于做一款火一款的那种。

PlugAI这边，公开资料上显示公司规模2-20，实际很可能就是2人。

也没有融资，完全“自举式”创业，正在寻求收购的原因是两位创始人闹掰了。

实际上，制作这样一个APP，并不需要太高的技术门槛，接入大模型就解决了大部分问题。

哄哄模拟器在流量爆炸之后，还把部分推理负载切到了谷歌Gemini等有一定免费额度的大模型，后来又得到月之暗面Kimi大模型的赞助，都用同一套代码只需切换API接口。

PlugAI更是直接被其他创业者评价为GPT套壳，受此启发，有人呼吁

不少开发者看到这个案例都在思考，如何找到下一个用户痛点。

有人总结到：关键在于找到人们想要，但很难直接表达出来的东西。

但总体上看来，两款爆火的AI应用，其实都在反映共同的趋势——

AI模型层的创新差不多了，是时候可以找到合适的点子，开启AI应用层面的创新了。

即便GPT-5来不来还不可知，其他开源LLM也在精进，但技术能力上的问题似乎已经不是*问题，*的问题还是能不能找到刚需痛点和合适的场景。

THE END

「哄女友挑战」上线爆火，两天烧掉10亿tokenAI新浪财经