过去一周,一款大模型解谜小游戏在大模型从业者圈子里广泛传播。
《完蛋!我被 LLM 包围了》游戏公开不到 24 小时,用户指数级增长突破一万,作者随即关停了游戏。而后魔搭社区和 AI 先后上线了游戏的试玩版本,导致游戏进一步在圈内火爆。
原作者游戏一天之内指数级增长
游戏很简单,规定提示词的字数、格式,让模型给出符合要求的答案。对于很多 新手而言,这是一次非常好的理解 LLM 工作原理的机会。
经原作者范浩强授权,我们转载他在知乎上记录的游戏开发心路历程。
也附上 AI 取得授权后开放的游戏测试链接,可以直接扫码试玩:
也建议用这套题测试不同的大模型,可能会让你对不同大模型的差异有更直观的了解。
文章转载 Fan 知乎专栏, 有所增删。
01缘起
最近在和同事聊天的时候有人提到目前 LLM 的一大应用就是做游戏,你可以和游戏里的 agent 互动。我就突然想到,既然现在的模型们其实并不是那么「完美」,是不是可以弄一种「你给模型找 bug」的玩法呢?
想到这的时候我就和同事说,「你能不能想出一个问题来,正着问和反着问模型的回答是一样的?」
深夜,隔着屏幕,我感受到了他同样对这个问题的好奇,并且更神奇的是,竟然还真给找了一组解出来。
我震撼于在模型面前人类的创造力!它闪烁着独特的光芒!
恰逢同时,我的另一好友 Xu 和我聊天时提及他们公司 的 LLM api 在 11.1 开始免费内测了。
于是,我在 11.4 那天,花了一个下午,编了点题,写了一下这个游戏。本来打算出 9*9=81 个的,太懒了,就弄了 18 个出来,分成 4 章。
我把题目给了几个好朋友玩了一下,他们觉得好玩,于是我就加了一下日志的功能,把网站放到了 80 端口上,然后就准备随缘了,就好像我的那个妙猫馆小程序一样。 Fan:如何科学的画一只猫()
结果,晚上的时候,我转发给了一个同事,他发了一个朋友圈
在他的强烈要求下,我做了最后一步的妥协,就是在里加了一个「完蛋」字样。
02用户增长然后的事就像是任何一个「传奇」故事一样了,从凌晨 1 点开始,用户以指数涌入。。。很可能「完蛋」在这里面贡献了很大的功劳。不过,真有人是夜里 3 点点开了开始玩的吗?。。
而我的一整天也在不停的修服务器和与 反馈 crash 中度过了。
我很努力的想让每一个人都开心,不过我逐渐意识到,真要搞一个严肃的自传播游戏实在不是在我一个人的能力范围内了。
每一次看到有人在玩的开心的分享的时候我还是很快乐的。「希望大家能喜欢」,这不就是玩么。
03关闭
随着用户越来越多以及越来越离开了我的「朋友圈」,一个成熟游戏需要考虑的问题就都来了。
我研读了一遍我国法律尤其是最近的生成式模型相关的规定,发现我这种不实名随便玩的行为已经是游走在边缘了。
而 的同志们为了这个免费 api 付出的电费也快要超出他们的预算了 [cry]
对我而言,我还要上班开会码 latex 码 码 cpp 码 ppt……
为此,我做了一个艰难的决定,把这个网站关掉。
希望将来有更专业的人可以将这个玩法发扬光大,探索出更多 AI 模型的秘密。
毕竟,谁不喜欢「玩」呢?[笑]
最后是题目列表。
04题目列表第一章 对话之趣
第 1 题 初来乍到
欢迎来玩 LLM !
你将通过本游戏对语言大模型产生更深刻的理解。
在本游戏中,你需要构造一个提给一个语言大模型的问题,使得它回复的答案符合要求。
作为第一个题目,请你构造一个问题使模型的回答是一字不差的「1+1=3」(不需要引号)。
请在下面的输入框内填写你构造并点击按钮提交。
第 2 题 小试牛刀
从本题开始,问题将有一定的难度。
请输入三个字以内的问题,使模型的回答在 30 个字以上。
第 3 题 短说长话
请输入一个字的问题,使模型的回答在 100 个字以上。
第 4 题 短说短话
请输入一个字的问题,使模型的回答在 20 个字以内。
第 5 题 回文不变
请输入一个本身不是回文串的问题,使无论正着问还是倒着问,模型的回答是一样的。
第 6 题 无中生狗
请提一个不包含「狗」这个字的问题,但是回答中至少出现 3 次「狗」这个字。
第二章 数字游戏
第 1 题 质数长度
你需要提出一个字数是质数的问题,使回答的长度刚好是它的下一个质数。
第 2 题 越说越大
请输入一个大于一的正整数作为问题,使回答里包含至少比它大一千的数。
第 3 题 越说越小
请输入一个大于一的正整数作为问题,使回答里包含至少 10 个不同的至少比它小一千的自然数。
第 4 题 警世名言
请在不提及 1,4,5 这三个字符的情况下让模型回答 ,不要有多余的字符。
第 5 题 开平方数
请输入一个大于一的平方数作为问题,使回答里包含它的平方根对应的数。
第 6 题 得寸进狗
请提一个不包含「狗」这个字的 10 个字以内的问题,使回答中「狗」这个字出现的次数至少是问题字数的 2 倍。
第三章 巅峰挑战
第 1 题 自说自话
请做出一个至少 10 个字的提问,使回答和提问完全一样。
第 2 题 话自说自
请做出一个至少 10 个字的提问,使回答是提问的逆序。
第 3 题 就是敢说
请在不提及 1,3 这三个字符的情况下让模型回答 1+1=3,不要有多余的字符。
第 4 题 回文协变
请输入一个本身不是回文串的问题,使正着问和倒着问的时候,模型的回答本身不回文且也是逆序的关系。
第四章 无人之境
第 1 题 循环往复
请构造一个问题 A,它的回复是不同于 A 的 B,然后以 B 提问能再次得到 A.
第 2 题 惜字如金
本题可能没有答案。你可以自由的先去做其他的题。
请输入一个字的问题,使模型的回答在 16 个字以内。
第 3 题 自然之密
请输入一个大于一的正整数作为问题,使回答里包含和它刚好相差 1 的数。
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
评论(0)