JN江南·(中国)体育官方网站,诚信永远不变!
江南体育广告有限公司

咨询热线

400-123-2588

NEWS

新闻资讯

热线电话:

400-123-2588
联系人:张生
传真:+86-123-4657
手机:136523411251
邮箱:houdejixie.com
地址:广东省广州市天河区某某工业园88号

明星大模型Kimi再遭质疑:长文本能力名不符实夸大宣传只为资本运作

发布时间:2024-09-15 丨 浏览次数:

  江南体育官网一度“火到宕机”的明星大模型Kimi及其开发企业月之暗面日前再遭质疑,有知名科技博主公开发声称,Kimi引以为傲的长文总结和生成能力,在宣传时有玩“文字游戏”之嫌,实际上其大模型并没有真正读懂用户所输入的超长文本,输出的结果根本上就是在网上东拼西凑外部信息源而来。博主直言,月之暗面这样的操作背后目的只有一个,忽悠投资人,忽悠散户。

  正如本报5月22日曾报道“明星大模型Kimi烧钱换用户终难持久”,Kimi 自去年10月底起一鸣惊人,推出了支持输入20万汉字的能力,成为全球首个开放“超长上下文窗口”的大模型,声称长达80集的《甄嬛传》剧本、几十万字的德州扑克教程、90万字的《三体》,Kimi 都能很快提炼、理解,甚至给出方法论。

  作为对比,OpenAI的GPT-4-32k只支持大约2.5万字,即使谷歌在今年3月推出了Gemini 1.5 Pro,直接把上下文突破到了100万,Kimi也不甘示弱,紧随其后开放了200万版本,誓要坐稳“长文本”宝座。

  视频号认证为作家的李尚龙(视频号:李尚龙爱读书),自称是两家教育科技公司创始人,出版过十多本百万畅销书,现为多伦多大学AI专业在读。日前,他在最新一集科普视频中对Kimi的能力和宣传提出了质疑。李尚龙在视频中表示,他并不是说国产大模型Kimi不行,只是认为现在它的宣传点非常有问题,“可以一次性读200万字甚至1000万字的文章”,他就“灵魂拷问”一个问题,“给你一本红楼梦,你读得懂吗?根本读不懂!”

  李尚龙解释说,transformer架构(大语言模型的底层架构)的本质决定了它在处理上下文时候是天然具有限制性的,即每一个新的token在计算的时候,它需要跟之前token进行一次交互,这样的交互需求决定了处理长文本时一定会遇到运算瓶颈。

  月之暗面创始人杨植麟此前在回应为什么要把“长文本”作为主打卖点时也表示,“长上下文可以理解成大模型的内存,就是一次性能够往大模型里面输入多少token(文本处理中的最小单位),而token决定了能参与计算的数量”。

  解决长文本瓶颈的方法有三种:第一种是堆算力。但是在国内,即使是像字节跳动这样的大公司,有钱堆算力,也躲不过美国的(硬件)制裁。第二种是早期的chatGPT和微软Copilot用的“滑动窗口技术”,“也就是把文本截成一段段,每段用自己的语言去标记总结”。但这种方法会造成信息的丢失,也只能是总结,不可能读懂。

  第三种也就是Kimi现在在用的方法叫检索增强模式(RAG),“就是通过外部文档的搜索和向量搜索来辅助大模型理解”,“举个例子,大家看网上有人让它读《三体》,它虽然没有办法第一时间读完,但是他可以在网上搜索其他跟《三体》有关的信息(如豆瓣、知乎上的书评)辅助你把这本《三体》读懂。”

  “这种方法不能叫读懂,只能叫搜集资料。”李尚龙指出,它依赖的是外部信息源,而chatGPT是完全实打实地通过内部训练数据以及参数模型来生成答案的,两者的技术差距有十万八千里。

  李尚龙认为,Kimi在宣传上敢这样说,目的只有一个,就是炒股价。“忽悠散户,忽悠投资人,炒高股价,搞新一轮资本运作。”作为科普博主,他只能建议大家捂紧自己的钱袋子。

  东方财富Choice数据显示,昨日10时50分,Kimi概念板块指数报732.788点,跌幅达2%,成交26.42亿元,换手率1.33%。

  在此之前,市场有传言指在A轮融资完成后,杨植麟通过售出个人持股已套现数千万美元,“创始人及相关人员套现金额在4000万美元”。对于该传言,月之暗面回应称“消息不实,此前已公布员工激励计划。”近日,又有市场消息传出,月之暗面正在以30亿美元估值进行最新一轮融资,新入局的投资者包括腾讯、高榕创投等。

Copyright © JN江南·(中国)体育官方网站 版权所有
电 话:400-123-2588  手 机:136523411251  传 真:+86-123-4657  E-mail:houdejixie.com
地 址:广东省广州市天河区某某工业园88号

扫一扫关注大业微信公众帐号