AI大模子的语言不同过错等:英语最重价,此外语言要贵良多

7 月 31 日新闻 ,言不英语言贵用户所运用的同过语言对于大型语言模子(LLM)的用度有很大的影响 ,可能组成英语运用者以及此外语言运用者之间的最重家养智能边界。最近的外语一项钻研展现 ,由于 OpenAI 等效率所接管的良多的效率器老本掂量以及计费的方式,英语输入以及输入的大模的语用度要比其余语言低良多,其中简体中文的言不英语言贵用度约莫是英语的两倍 ,西班牙语是同过英语的 1.5 倍,而缅甸的最重掸语则是英语的 15 倍 。
IT之家留意到,外语推特用户 Dylan Patel(@dlan522p)分享了一张照片,良多揭示了牛津大学妨碍的大模的语一项钻研,该钻研发现,言不英语言贵让一个 LLM 处置一句缅甸语句子需要 198 个词元(tokens),同过而同样的句子用英语写惟独要 17 个词元 。词元代表了经由 API(如 OpenAI 的 ChatGPT 或者 Anthropic 的 Claude 2)碰头 LLM 所需的合计力老本 ,这象征着缅甸语句子运用这种效率的老本比英语句子逾越 11 倍。
词元化模子(即家养智能公司将用户输入转换为合计老本的方式)象征着 ,除了英语之外的其余语言运用以及磨炼模子要贵良多 。这是由于像中文这样的语言有着差距 、更重大的妄想(不论是从语法仍是字符数目上),导致它们需要更高的词元化率 。好比,凭证 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中惟独要两个词元,但在简体中文中需要八个词元。尽管简体中文文本惟独 4 个字符(你的爱意),而英文有 14 个字符。
【源头 :IT之家】返回搜狐,魔难更多
责任编纂 :
相关文章
原创 季中赛步行者为什么打不过湖人?球迷赛后一番话直接戳中要害
原标题:季中赛步行者为什么打不过湖人?球迷赛后一番话直接戳中要害 季中赛步行者为什么打不过湖人?球迷赛后一番话直接戳中要害。网友热议一针见血地指出:其实并不是轻取,步行者分数一直粘着十分之内,第2025-02-28vivo X100系列即将开售!能直接拍太阳,224万+跑分见证超强性能
原标题:vivo X100系列即将开售!能直接拍太阳,224万+跑分见证超强性能 最近市面上又出了不少新机,想要换新机的朋友们有得选了,不过如果是喜欢用手机拍照的朋友,那么能够直接拍摄太阳的vi2025-02-28原创确认!足球报宣布利好消息,上海申花迎喜讯,吴金贵成大赢家
吴金贵成大赢家!上海申花的好消息正式确认!近日,《足球报》报道了上海申花俱乐部引进重大变动的好消息。这个好消息的背后,是主教练吴金贵的默默努力和专业精神,让上海申花重新焕发了青春活力。下面,本文将详细2025-02-28轻松工笔!科曼全场数据:2射1传4次关键传球,获评10分满分
原问题:轻松工笔!科曼全场数据:2射1传4次关键传球,获评10分满分直播吧11月19日讯 欧预赛法国14-0直布罗陀,科曼首收回战66分钟被登贝莱换下,球员此役展现惊艳2射1传,球员本场重点数据如下:2025-02-28- 北京时间12月10日,CBA常规赛第15轮展开激战,我们一起看看最新的积分榜变动,主要的信息如下:辽宁主场113-89双杀北控迎来两连胜,稳居第一;广厦121-104击败同曦迎来三连胜;上海119-12025-02-28
红发王妃消失3年,留下帅气儿子和漂亮女儿,摩洛哥国王誓言成空香港第一情妇:曾是马景涛挚爱,被黑道大佬打掉子宫,至今无人娶
在国外的皇室发展史当中,有两位美丽的王妃给人们留下了非常深刻的印象。一个是戴安娜王妃,而另一个则是北非摩洛哥的红发王妃拉拉·萨尔玛。萨尔玛有着如童话故事般的绝美容颜,一头红色的秀发,凝脂的肌肤,明亮的2025-02-28
最新评论