GameMale
登陆 / 注册 搜索

USERCENTER

SEARCHSITE

搜索

查看: 1033|回复: 25
收起左侧

[技术交流] 【看法】LLM还是很难准确回答问题

[复制链接] |关注本帖

邪恶的面具堕落之舞风雪之家香喷喷的烤鸡眼镜蛇图腾寻觅牧羊人

     楼主| 白冥 发表于 2024-6-25 09:25:06 | 显示全部楼层 |阅读模式 |取消关注该作者的回复
    本帖最后由 白冥 于 2024-6-25 14:14 编辑

      现在的大语言模型(LLM)还是很难准确地回答问题。

      比如将“向Java的可变数组插入新元素时容量不足,可变数组是不是通过虚拟机JVM向操作系统请求‘可以容纳原数组长度的1.5倍及以上的新数组的内存块’”误解释成“向Java的可变数组插入新元素时容量不足,可变数组是不是通过虚拟机JVM向操作系统请求‘恰好为原数组长度的1.5倍及以上的新数组大小的内存块’”。
      事实上这不是LLM第一次出现答非所问的情况了,无论是哪种LLM,都会出现这种情况。
      举个例子,当你询问“C语言中,是不是‘任何’函数‘都可以’调用自身”时,文心一言和ChatGPT都会回答“C语言不是任何的函数‘都适合’或‘都需要’调用自身”。
      对于LLM来说,你问的问题无非就是单词串,它们所回答的也无非是单词串,它们的回答可能符合语法,但不一定符合语义。“都可以”与“都需要”或“都适合”是不一样的,前者代表一种权利,后者代表一种限制。
      就像你问“每个人都可以有8小时的娱乐时间吗”,结果有人回答“不是每个人都需要有8小时的娱乐时间”,令人感到十分别扭。
      很多时候,LLM大部分回复仅仅只是追求最多关键字匹配,收刮自己的语料库或者网络爬取文章,打印出它们算法所判定为“最匹配问题的”回答,并没有理解文本的能力。
      LLM还有一种问题也经常出现,即逻辑推导的功能缺陷。
      假设你询问文心一言或ChatGPT“在Java中,所有的类都直接或间接地继承自Object类吗”,它们一定会给出肯定的回答。但是如果你询问“在Java中,Object类是直接或间接地继承自Object类的吗”,这时候必定会给出否定且批评的回答。
      对于每一个合格的Java学习者来说,“Java中,一个类不能继承自不存在的类”与“Java中,一个类在完整声明之前是不存在的”是常识,很自然就可以推得“Java中,一个类不能继承它自己”,那么很自然,“Java中,Object类当然不能直接或间接继承Object类”,所以“Java中,并非所有的类都直接或间接地继承自Object类”。
      显然,第一个问题,LLM答错了。而第二个问题,反映出LLM明显具有“惰性思考”缺陷,实际上也是一种简单的对于关键字的检索和匹配,没有真正的思考,否则第一个问题不可能答错。
      与人在处理问题时的操作不同,LLM在处理问题时有对知识储备和关联思考的能力的缺陷。面对未知问题时,人会尝试根据已有知识进行推理和思考,而不仅仅是选择最匹配的回答。LLM更多地是依赖于关键词的检索和匹配,而非真正的思考,只是一种假装思考的照抄。
      在语言处理方面,LLM也有很大的问题。幻觉输出,是LLM的一种“无中生有”的回答,这种问题经常发生在要求LLM分析文艺作品时。它们并没有理解文艺作品的能力,于是通过抓取问题的关键词,直接堆砌某些作品鉴赏的语句,给出一篇不伦不类的“分析”内容。
      收起(3)
    回复

    使用道具 举报

    男色诱惑丹妮莉丝·坦格利安荒野大镖客:救赎 II沙漠鸵鸟林中松鼠珊瑚泡泡鱼神奇四叶草神圣十字章

      目前LLM模型回答问题的准确性不高,只会一些基础问题,在下只用来玩角色扮演
        收起(2)
      回复

      使用道具 举报

      不曾寄出的信件『随时随地开启!』漂洋小船『随时随地开启!』冒险用指南针破损的旧书丛林的鸟飞走了雪王的心脏人鱼之泪幽灵竹筒

        LLM确实目前感觉还是不够智能惹
          收起(5)
        回复

        使用道具 举报

        缘起星空虚空之海的鲸

          回复

          使用道具 举报

          『住在GM村』无瑕的回忆朴素的誓言小丑与格雷与星光璀璨『落樱缤纷』『灰域来音』『眼榴』『钟楼盐水棒冰』『泥潭颂唱者』『逆境中的幸运女神』

            看描述LLM可以用来训练一下胡搅蛮缠的角色
              收起(1)
            回复

            使用道具 举报

            史莱姆牧场吸血魔蝠萨菲罗斯苏醒的格罗姆圣甲虫秘典可爱黑猫诺克提斯·路西斯·伽拉姆夏日柯基美恐:新的开始

              chat4.0一样,问一下审计问题就给我在那里扯犊子,20刀就这?,不过用来进行数据总结还不错
                收起(3)
              回复

              使用道具 举报

              凯登‧阿兰科裸体克里斯黑曜石赤螯蝎克里斯‧雷德菲尔德夜魔护符诺曼底号男巫之歌肥皂雪王的心脏艾吉奥

                zrfz 发表于 2024-6-25 10:31:07 | 显示全部楼层 |取消关注该作者的回复

                GLM-4 turbo
                应该是国产模型里面比较强的了
                试了一下楼主说的,没遇到这个问题
                  收起(4)
                回复

                使用道具 举报

                虚空之海的鲸『私有海域』『钜鲸』『星河碎片』『召唤好运的角笛』『交钥匙了!』『矩阵谜钥Ⓖ』十周年扭蛋 - 红『落樱缤纷』红心玉

                  回复

                  使用道具 举报

                  百相千面-晦永远的克叔業火死鬥实现梦想官复原职虚空之海的鲸Zootopia幸运女神的微笑『逆境中的幸运女神』御医神兔

                    现在的很多模型需要设计好提问语句才能得到比较想要的结果,感觉有点像AI训练了我们
                    回复

                    使用道具 举报

                    实现梦想業火死鬥魔法不朽·传奇不熄卡洛斯·奥利维拉白野威十年一梦官复原职男巫之歌永浴爱河虚空之海的鲸

                      回复

                      使用道具 举报

                      近地夜航璀璨金币驯化腐化龙幼崽黑龙幼崽驯化红龙幼崽瑞雪兆丰年,生灵万物新猎鹰图腾

                        初学者表示AI能解决很多基础问题(比如报错和网页代码
                        应付工作已经够用了】
                        回复

                        使用道具 举报

                        无瑕的回忆『召唤好运的角笛』绿茵宝钻

                          AncL 发表于 2024-6-25 11:48:02 | 显示全部楼层 |取消关注该作者的回复
                          回复

                          使用道具 举报

                          【夏日限定】夏日的泰凯斯灵魂之椅史莱姆牧场阿拉喵?神灯和你一起飞行的皮卡丘秘密空瓶吃饱金币的Doge深渊遗物男巫之歌丹雀衔五穗,人间始丰登

                            还是比较看好AI的发展的    AI会举一反三   我遇到的绝大多数问题都可以得到答案
                            回复

                            使用道具 举报

                            收到情书灵光补脑剂烈焰天使弓

                              回复

                              使用道具 举报

                              恶魔城瑞雪兆丰年,生灵万物新质量效应三部曲约翰-117龙血之斧伪造的红石林中松鼠驯化红龙幼崽

                                zyz 发表于 2024-6-25 14:31:09 | 显示全部楼层 |取消关注该作者的回复
                                回复

                                使用道具 举报

                                希尔瓦娜斯·风行者麦迪文(Medivh)阿尔萨斯‧米奈希尔创生之柱卡德加(Khadgar)安杜因·乌瑞恩我的天使夏日柯基幸福的小阿尔吃饱金币的Doge

                                  回复

                                  使用道具 举报

                                  SCP-s-1889-第二页缘起星空虚空之海的鲸裸体克里斯圣甲虫秘典『随时随地开启!』被释放的灵魂『随时随地开启!』无尽的怀表男巫之歌

                                    调教gpt写代码的时候总是要把需求描述的相当清楚,包括报错代码的提供给他,多次反复才能写出来想要的东西。
                                    回复

                                    使用道具 举报

                                    近地夜航堕落之舞古老金币GM論壇榮譽勛章六出冰花幽浮起司煲物理学圣剑沙漠鸵鸟

                                      尝试用英语呢?我发现英文的准确度会高一点,不知道是模型训练的翻译问题?
                                      回复

                                      使用道具 举报

                                      牧羊人寻觅

                                        回复

                                        使用道具 举报

                                        脉律辐石官复原职丹妮莉丝·坦格利安『逆境中的幸运女神』幸运女神的微笑我的冶金打火机羽毛笔劫掠核芯御医神兔虚空之海的鲸

                                          XLK 发表于 2024-6-27 02:42:15 | 显示全部楼层 |取消关注该作者的回复
                                          回复

                                          使用道具 举报

                                          您需要登录后才可以回帖 登录 | 立即注册

                                          本版积分规则

                                          文字版|手机版|小黑屋|GameMale

                                          GMT+8, 2024-12-22 10:26 , Processed in 0.176862 second(s), 143 queries , Redis On.

                                          Copyright © 2013-2024 GameMale

                                          All Rights Reserved.

                                          快速回复 返回列表