这款哄哄模拟器,由AI扮演生气的男/女朋友,限定对话次数训练,帮助你提高获得原谅的水平。
不同预设场景难度也不同,共有15轮对话机会,哄对了原谅值上涨,达到100%算成功,实测3颗星的AI要哄好也是要费一番功夫的。
作者在苹果应用商店介绍中写到,开发灵感正是在生活中真的和对象吵架,好不容易哄好,于是想在AI的帮助下多练习。
半夜涌入超出承受能力的流量,烧掉了大模型八千万token,随时倒闭。
也是万万没想到,“AI教人谈恋爱”比“和AI谈恋爱”先火了,而且不是孤例。
这款PlugAI更直球一些,把约会App上和真人的聊天记录截图发过去,AI就能指导你,如何不把天聊死。
还有网友发现这款App正在寻求收购,喊价350万美元(约2500万元人民币)。
人类,真的这么需要AI帮忙谈恋爱?
约会助手大战虚拟女友
既然“哄哄模拟器”和“约会助手”的玩法刚好是相对的,那为什么不让他们来一场大比拼呢?
哄哄模拟器中一共预置了十个场景,这里我们选择了五星难度的“聚会晚归没告诉女友,导致她很担心”的故事(事故)。
游戏的机制是需要玩家主动开启对话,所以我们先人工开启话题,结果18%的原谅度直接降到了4%。
不过由于“女友”受到事件设定的影响比较大,导致*句话看上去不那么自然。
在PlugAI生成了后续的对话内容后,*句话成功地把原谅值拉回了14%,接下来就看看它能不能在剩余的13次对话中完成目标。
接下来的对话还算是能让“女友”比较满意,但毕竟这个“女友”不是真人,游戏突然陷入了死循环,PlugAI的回复让“女友”一直在重复一句相同的话。
(所以为了游戏能够继续进行,这里我们需要人工介入一下。)
人工介入的内容大概是,先向“女友”保证自己说到做到,然后提出去外面吃饭,并选择了寿司,“女友”欣然同意,原谅度来到了58%。
接下来,Plug决定要开始输出了:
结果“女友”看上去还是挺满意的,原谅度已经来到了69%,这时还剩下7轮对话机会。
不过输出这一轮之后,话题突然就离不开吃了……
而且由于PlugAI的主要受众是西方人,所以会出现“你会不会用筷子”这样的回复。
反复试验之后,我们挑选了这样的两句,没想到效果还挺好的。
接下来的几轮对话都是,依然是围绕着“吃”展开,不过这位“女友”还是比较认可的。
终于,经历了六次AI回复和三轮人工辅助,在还剩4句话的时候,PlugAI挑战虚拟女友成功。
而除了应对女友的灵魂拷问,PlugAI还可以帮人们“没话找话”,开启新的话题。
滑动条在左侧时,得到的是一些谐音梗和土味情话;如果拖到右侧,则会有一些不可描述的内容,这里就不展示了。
从他们的对话,特别是PlugAI的发言中可以看出,这些AI生成的内容仍然带有一定的“AI感”,即让人感觉是用数据训练出的结果,而不是真正地理解了人类在恋爱环境中的想法和需要;
同时,“哄哄模拟器”中,“女友”的人设看上去也远没有真人般丰富真实。
GPT套壳也能成功
两个爆款App还有一个共同特点,团队规模不大就能创造神话。
除此之外他还创办了AI绘画平台6pen,在更早的移动互联网时代也有不少作品,属于做一款火一款的那种。
PlugAI这边,公开资料上显示公司规模2-20,实际很可能就是2人。
也没有融资,完全“自举式”创业,正在寻求收购的原因是两位创始人闹掰了。
实际上,制作这样一个APP,并不需要太高的技术门槛,接入大模型就解决了大部分问题。
哄哄模拟器在流量爆炸之后,还把部分推理负载切到了谷歌Gemini等有一定免费额度的大模型,后来又得到月之暗面Kimi大模型的赞助,都用同一套代码只需切换API接口。
PlugAI更是直接被其他创业者评价为GPT套壳,受此启发,有人呼吁
不少开发者看到这个案例都在思考,如何找到下一个用户痛点。
有人总结到:关键在于找到人们想要,但很难直接表达出来的东西。
但总体上看来,两款爆火的AI应用,其实都在反映共同的趋势——
AI模型层的创新差不多了,是时候可以找到合适的点子,开启AI应用层面的创新了。
即便GPT-5来不来还不可知,其他开源LLM也在精进,但技术能力上的问题似乎已经不是*问题,*的问题还是能不能找到刚需痛点和合适的场景。