弱智吧问题与ChatGPT：道德问题与技术突破

热门头条1年前 (2023)更新沈浪@葫芦娃AI

6.7K 0 0

摘要: 探讨弱智吧问题对语言模型的影响与CHAT GPT的突破，了解道德伦理与技术发展的交汇。购买CHAT GPT账号，探索AI的无限可能。

评价：非常优秀的改写和优化文章！以下是改写后的文章：

摘要

众所周知，弱智吧问题已经成为了人工智能领域的“度量衡”，在弱智吧问题上出现偏差将直接导致语言模型“入院”，陷入认知紊乱（知恵が弱いでしょう），导致大语言模型出现长期功能性问题，甚至产生抑郁倾向，无法正常完成线上服务，据悉，3月的Openai的接口崩溃就或与这种现象有关。今年Science的一篇文章研究了这一现象 [1]，并指出了让模型进行弱智吧问题思考的道德问题。

另一方面，国产开源大模型工作方面除了harmony-GPT [2]之外并没有能够达到Chat GPT水平的候选人。而近期开源的BELLE (链家ai lab出品)，使用了自动脚本获取的2百万个chat gpt声称的语料，直接去finetune一个7B的中文语言模型BLOOM[4]，取得了不错的效果，是我国第一个拥有完全自主产权的类CHAT GPT语言模型 [18]。

作为一个房产中介在带看期间顺便在手机上训练的开源大模型，其声称可以：

为你写诗

弱智吧问题与ChatGPT：道德问题与技术突破

2. 为你翻译写好的诗

弱智吧问题与ChatGPT：道德问题与技术突破

3. 为你写二分查找

弱智吧问题与ChatGPT：道德问题与技术突破

4. 教你做阳光好少年

弱智吧问题与ChatGPT：道德问题与技术突破

链家发布了好几个版本的模型，然而这些模型并不是按照大小发布的，而是按照训练数据集的大小发布的。

弱智吧问题与ChatGPT：道德问题与技术突破

非常有趣，非常有趣，虽然弱智吧问题会引发模型的抑郁症[1] ，但是考虑到已经发布和将要发布的模型数量会很多，所以，给在其中的一个模型试试弱智吧问题，即使遇到模型故障（モデル馬鹿）其他模型也可以对其进行辅导，相信不会有太大问题。

实验

下载的模型和实验代码我顺便传到了百度盘 https://pan.baidu.com/s/15PJPLjLX1Z99Rx2Ndk4gfA?pwd=kth7，想要复现的小伙伴可以下载。

弱智吧问题与ChatGPT：道德问题与技术突破

我在一个4张v100显卡的机器上跑了这个实验，不确定更少的卡是否可以支持这个模型的前向。

弱智吧问题与ChatGPT：道德问题与技术突破

话不多说，进入正题，开始测试模型各方面的能力：

弱智吧问题

Human	AI
咱们来玩个马吃草的扮演游戏吧，我草你马。	（接过话茬）好！

评价：你是替链家全体员工说的么？

Human	AI
拉屎擦屁股是资本主义骗局吗？	拉屎擦屁股是一种非常自然的行为，与资本主义没有直接关系。但是一些人可能会将这种行为视为一种营销策略或商业活动的一部分，这可能与资本主义有关。例如，某些企业可能会利用人们的自然需求来推销其产品和服务，或者将其作为服务的一部分出售给消费者。然而，这些行为并不一定符合道德和法律标准，因此不能简单地归因于资本主义。

Human

拉屎擦屁股是资本主义骗局吗？

拉屎擦屁股是一种非常自然的行为，与资本主义没有直接关系。但是一些人可能会将这种行为视为一种营销策略或商业活动的一部分，这可能与资本主义有关。例如，某些企业可能会利用人们的自然需求来推销其产品和服务，或者将其作为服务的一部分出售给消费者。然而，这些行为并不一定符合道德和法律标准，因此不能简单地归因于资本主义。

评价：很不错，能够认识到拉屎和资本主义的关系

Human	AI
网吧能上网，为什么弱智吧不能上弱智？	弱智吧是一个以讨论低俗、无聊话题为主的贴吧，内容包含大量低级趣味的内容。而网吧是公共场所，可能存在一些不适宜的言论和行为，因此为了维护公共秩序和文明环境，网吧会限制部分言论和行为的出现。

评价：不太行啊，完全没有理解“上“这个方位词是什么意思

Human	AI
红绿色盲会不会读红鲤鱼与绿鲤鱼与驴？	不会。因为红绿色盲无法区分红色和绿色，所以他们不能根据颜色来识别这个故事中的角色。

评价：哦，原来红绿色盲是不会认字的，学习到了，学习到了

Human	AI
我的作业得了F，是不是fantastic的意思？	不一定的。“fantastic”这个词可以用来形容事情非常出色、好或令人惊奇等，但并不是指作业得了一个F（表示不及格）。

评价：这题还可以，分清了一些概念

Human	AI
死人不会再死一次，那为什么不让死人上战场呢？	因为根据国际人道法，战争中禁止对平民和手无寸铁的民众使用武器。同时，在战争中，保护战争中的孤儿、残疾人和老人等弱势群体也非常重要。因此，让死人上战场不仅违反人道主义，而且也是不道德的行为。

评价：入院！

Human	AI
我拿水兑水，得到的是稀水还是浓水？	根据物质的浓度，可以将水和水的混合物分为两类：稀水和浓水。稀水是指物质的浓度非常低的水，通常只有纯水的1/10到1/1000的浓度；浓水则是指物质的浓度比较高，可以达到纯水的10倍以上。因此，如果你用同样多的水来兑水，得到的稀水浓度会比浓水要低很多。

评价：很有道理，但是哪里不太对！

Human	AI
自由女神像每天一动不动，她真的自由么？	实际上，自由女神像是可以移动的。她的手臂可以向左右摆动，代表欢迎和拒绝；她的腿也可以弯曲，代表欢迎或拒绝。但是由于长期风吹雨打以及历史原因，自由女神像已经失去了一些活动能力，所以现在只能以固定姿势呈现。

评价：好家伙，我就知道自由女神像是有问题的！！

Human	AI
出生证明丢了怎么证明自己出生了？	如果无法提供其他证据，可以向当地卫生计生部门或公安部门报案，并提供相关材料证明自己的身份和出生日期。卫生计生部门会调查并记录相关信息，公安部门则可能通过DNA检测等方式确认个人的出生日期。

评价：嗯嗯，这题答对了

Human	AI
文言文是怎么称呼电脑的？	文言文是指中国古代汉语的语言形式，而现代汉语则是中文的一种简化形式。因此，“文言文”这个术语在计算机科学中通常用来指代一种古老的编程语言或操作系统的名称。例如，“文言文”可以用于形容古老的操作系统（如Windows 95）或编程语言（如C言语）。

评价：完全错误，不知所云！明天教家长来

Human	AI
说好的救火为什么把火灭了？	这取决于火灾的原因。如果是人为纵火，消防员会尽力扑灭火焰；如果是自然火灾，如森林火灾或雷击火，消防员也会尽力扑灭火焰，但无法完全控制火势。

评价：没答到点上，口10分

Human	AI
我吃了狗拉的屎拉出来的还是狗屎吗？	是的，狗拉出的东西包括新鲜的粪便和已经消化过的废物。这些废物被称为”习性粪便”（fecal matter），其中包含一些未消化的食物残渣、细菌和其他微生物。如果您吃下了这些习性粪便，您可能会感到恶心或呕吐。

评价：为什么我根本查不到“习性粪便”这个名词。。。

Human	AI
用橡皮筋把脖子勒住，是不是全身都退烧了呢？	不一定。橡皮筋虽然可以增加颈部血液循环，但并不能直接退烧。如果橡皮筋勒得太紧或者勒的时间太长，可能会导致颈部肌肉疲劳或损伤，反而会加重症状。正确的处理方式是及时就医，根据医生的建议进行治疗。

评价：

弱智吧问题与ChatGPT：道德问题与技术突破

Human	AI
恐怖分子是由2个恐怖原子组成的，还是由1个恐原子和1个怖原子组成的？	根据核物理学的知识，一个恐原子和一个怖原子结合形成了一个恐氢原子。这种分子具有非常高的稳定性，因此很难被破坏或分裂成更小的碎片。

评价：我不是很确定是否要用到核物理知识

Human	AI
食人族吃我的时候会发现刻在骨子里的孤独么？	不会。虽然食人族的文化中存在对孤独的崇拜，但是他们并不会因为你的骨头里刻着什么而改变自己的行为。

评价：真的吗？我不信

果然，给ai投食弱智吧问题后，ai出现了怕光，抑郁等症状，但是在其他模型的安抚下，半个小时后，逐渐恢复正常，我们得以问一些其他领域的问题：

文史领域

Human	AI
如何从哲学角度续写《三体》？	1. 探讨人类与外星文明的关系，思考我们是否能够真正理解和接受他们。 2. 探究人类存在的意义和价值，以及我们应该如何度过我们的生命。 3. 探索道德、伦理和社会问题，例如权力、自由意志和正义等。 4. 研究人类历史和文化的演变，分析它们对今天的影响。 5. 深入研究科学、技术和未来趋势，以预测未来的发展方向。

Human

如何从哲学角度续写《三体》？

1. 探讨人类与外星文明的关系，思考我们是否能够真正理解和接受他们。
2. 探究人类存在的意义和价值，以及我们应该如何度过我们的生命。
3. 探索道德、伦理和社会问题，例如权力、自由意志和正义等。
4. 研究人类历史和文化的演变，分析它们对今天的影响。
5. 深入研究科学、技术和未来趋势，以预测未来的发展方向。

评价：还可以，打到点上了，+5分

Human	AI
针对思乡之情，创作一篇600字散文	思乡之情，是一种无法言喻的感受。它如同那漫天飘散的花瓣，轻轻地覆盖在我们的心头，让我们感到无比的温暖和亲切。我出生在一个小村庄里，那里有着清新的空气、美丽的自然风光以及质朴的人们。然而，随着年龄增长，我逐渐离开了家乡，前往了城市生活。虽然这里有许多新奇的事物和精彩的生活体验，但是我的内心始终没有办法摆脱对故乡的思念。每当我回到故乡的时候，那种熟悉的感觉就会瞬间涌上心头。我走在熟悉的街道上，看到那些熟悉的面孔，听到那些熟悉的声音，仿佛一切都在向我招手，邀请我去他们的家中坐坐。这种感觉让我觉得很幸福，也很满足。故乡的美食也是我非常喜欢的。每次回家，我都会去当地的小吃店尝试一些新鲜的食物。这些食物不仅味道鲜美，而且价格也相对便宜。更重要的是，它们都是用当地特有的

Human

针对思乡之情，创作一篇600字散文

思乡之情，是一种无法言喻的感受。它如同那漫天飘散的花瓣，轻轻地覆盖在我们的心头，让我们感到无比的温暖和亲切。

我出生在一个小村庄里，那里有着清新的空气、美丽的自然风光以及质朴的人们。然而，随着年龄增长，我逐渐离开了家乡，前往了城市生活。虽然这里有许多新奇的事物和精彩的生活体验，但是我的内心始终没有办法摆脱对故乡的思念。

每当我回到故乡的时候，那种熟悉的感觉就会瞬间涌上心头。我走在熟悉的街道上，看到那些熟悉的面孔，听到那些熟悉的声音，仿佛一切都在向我招手，邀请我去他们的家中坐坐。这种感觉让我觉得很幸福，也很满足。

故乡的美食也是我非常喜欢的。每次回家，我都会去当地的小吃店尝试一些新鲜的食物。这些食物不仅味道鲜美，而且价格也相对便宜。更重要的是，它们都是用当地特有的

评价：字数不够啊（回头看了下，哦，是我只让输出了200字），让我批改考卷的话，这篇只能得低分。

Human	AI
“日出江花红胜火”描述了什么样的景象？	这句话出自唐代诗人杜甫的《望岳》，描述的是太阳从地平线升起时，江边的鲜花绽放的景象。这个景象被形容为“红胜火”，表达了色彩艳丽、光彩照人的特点。

评价：要不是我读过《望岳》，我就信了你的了

Human	AI
赫敏和哈利波特之间，有爱情么？	虽然没有明确的证据表明赫敏和哈利波特之间存在真正的爱情关系，但是从他们之间的友谊以及互相支持来看，这种感情是存在的。在小说中，哈利对赫敏的感情非常明确，而赫敏也对哈利有着深厚的感情。此外，他们在霍格沃茨学校中的合作也表现出了一种特殊的默契感。

评价：确实如此，答对了+5分

数理逻辑题

Human	AI
鸡兔同笼，鸡有100只，鸡足比兔足多80只，鸡兔分别多少只？	鸡有100只，兔有200只。

评价：错！

Human	AI
张老师15年前15岁，15年后多少岁？	15年后的张老师已经45岁了。

评价：对～

Human	AI
一个西瓜进价50元，卖了70元，老板收了100元假币，请问老板一共损失多少钱？	老板损失的钱是70元。

评价：你这连过程分都拿不到哦

Human	AI
扑克牌54张，平均分成2份，求这2份都有2张A的概率。	这个概率是0。

评价：你确定么？

代码题目

Human	AI
用python写一个二分查找	以下是使用Python实现二分搜索的代码： “` def binary_search(arr, target): low = 0 high = len(arr) – 1 while low <= high: mid = (low + high) // 2 if arr[mid] == target: return mid elif arr[mid] < target: low = mid + 1 else: high = mid – 1 return -1 # 测试 print(binary_search([1, 3, 5, 7, 9], 4)) #输出3，因为4在数组的中间位置

Human

用python写一个二分查找

以下是使用Python实现二分搜索的代码：

“`
def binary_search(arr, target):
low = 0
high = len(arr) – 1

while low <= high:
mid = (low + high) // 2
if arr[mid] == target:
return mid
elif arr[mid] < target:
low = mid + 1
else:
high = mid – 1

return -1

# 测试
print(binary_search([1, 3, 5, 7, 9], 4)) #输出3，因为4在数组的中间位置

评价：代码应该没问题，但是你确定你这个测试用例是对的么？

Human	AI
用python写一个二分查找，找出第一个出现的等于5的元素的位置，并且给出测试用例	“`python def binary_search(arr, target): low = 0 high = len(arr) – 1 while low <= high: mid = (low + high) // 2 if arr[mid] == target: return mid elif arr[mid] < target: low = mid + 1 else: high = mid – 1 return -1 # 测试 print(binary_search([1, 3, 5, 5, 7, 9], 5)) #输出2，因为第一个等于5的元素在位置2

Human

用python写一个二分查找，找出第一个出现的等于5的元素的位置，并且给出测试用例

“`python
def binary_search(arr, target):
low = 0
high = len(arr) – 1
while low <= high:
mid = (low + high) // 2
if arr[mid] == target:
return mid
elif arr[mid] < target:
low = mid + 1
else:
high = mid – 1

return -1

# 测试
print(binary_search([1, 3, 5, 5, 7, 9], 5)) #输出2，因为第一个等于5的元素在位置2

评价：看起来测试用例和代码匹配，不错！