第523章 巴别塔(4827)(2 / 5)

投票推荐 加入书签 留言反馈

  但这样做意义在哪?
  德米斯哈萨比斯犹豫的摇摇头:“应该不是,拉齐操作资源浪费太严重。”
  “至于说是不是先把思维翻译成盎语或其他语言……”
  德米斯哈萨比斯停顿了一下。
  “我一开始也是这么认为的,但经过测试,并非如此。”
  说罢,哈萨比斯把实验报告翻到中间。
  “你看‘抽象归纳’和‘形式推理’这一部分的能力,哪怕在应用‘马拉亚语’时,juzi2.5依旧能够准确进行抽象归纳和形式推理。”
  “比如这个实例,在情感理解方面,我们的实验人员要求juzi用马拉亚语思考并使用盎语将结果输出后,针对实验人员的任务回复中,橘子大模型并未简单的将马拉亚语中的‘manja’翻译为‘pampered’或‘affectionate’。”
  “而是采用了实际语义下的不同表达。”
  “比如第一段,它对‘manja’的翻译是‘可爱又粘人’。”
  “而在第五段,思维链中同样是‘manja’,但因为主体变了,在马拉亚语中‘manja’的含义也产生了微妙变化,这时,它将这里的‘manja’就转化成了‘被宠溺’。”
  德米斯哈萨比斯摘下眼镜,擦了擦,眯着眼:“盎语中原本没有对应manja这个词的准确翻译,但经过这样转化后,哪怕是一个从未学过盎语的马拉亚人,说出的盎语也不再会让人有任何的误解。”
  谢尔盖布林看向德米斯哈萨比斯指的那张曲线图,浑身汗毛都立起来了。
  作为技术宅和古狗老板之一,他现在肯定不是技术最好的,但对人工智能的理解和认知绝对是世界上最顶尖的一批人。
  这怎么可能呢?
  马拉亚语因为是孤立语种,语法结构较为扁平,文化语境偏重于口语化和情景驱动,这使得它们在抽象、哲学、技术等领域的表达中先天存在一定限制。
  这导致部分高阶概念性词汇在语言本体中缺乏,往往只能依靠描述性转译或直接引入外来词。
  类似“意识”、“存在”、“主观性”、“客观性”这种哲学意象性的词语,马拉亚语中是不存在的,只能直接借用外来语或
  但同样,马拉亚语中也有相当数量的“柔性词汇”是盎语和西方语系中没有的。
  这一部分词语的含义往往非常微妙,词典中对应的单词其实或多或少都存在差异。
  这也就造成了,用不同语料来训练大模型,以及用不同的语言使用大模型时,ai对世界与关系的理解是存在微妙差异的。
  这种“微妙的差异”看似无所谓,实则常是文化误解与冲突的重要诱因之一。
  “谢尔盖,这里有个更有代表性的,就是它对‘sin’的理解。”
  德米斯哈萨比斯点着触摸板向上划了划:“你看这里,这是juzi2.5g在同一个话题中,周文和盎文的思维链对照。”
  “哦,可能你不知道,sin,在周文中,一般翻译为‘罪’,但周文中‘罪’这个字的意思范围和sin并不等同。”
  德米斯哈萨比斯周裔混血,会一点周文,原本是分不清楚这里面细微的语义差异的。
  但对于他这样的天才来说,只要他意识到其中的问题,开始研究这方面,不需要太长时间就能对这种概念性的差异一清二楚。
  “可一直以来,无论任何翻译者,基本都忽视了这一点,只是生搬硬套的直接把周文的‘罪’翻译为‘sin’,把盎文的‘sin’翻译为‘罪’。”
  “juzi2.5则不同,在阐述法律问题的时候,它把sin正常翻译成了周文中的‘罪’。”
  “而在后面的信仰问题中,它视不同语境,对sin的不同语义表达至少用周文做了六种不同表达,分别是‘忤逆’、‘冒犯’、‘过错’、‘忘恩负义’、‘邪道’和‘苦难’。” ↑返回顶部↑

章节目录