创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
动漫区 愚蠢的AI,9.11>9.9,科技巨头需要反想 - 四房色播
四房色播
成人快播电影 你的位置:四房色播 > 成人快播电影 > 动漫区 愚蠢的AI,9.11>9.9,科技巨头需要反想

动漫区 愚蠢的AI,9.11>9.9,科技巨头需要反想

发布日期:2024-07-24 01:55    点击次数:94

动漫区 愚蠢的AI,9.11>9.9,科技巨头需要反想

最近有个问题挺火动漫区,歌手2024的适度,孙楠13.8%排第三,CM13.11%排第四,竟然引起网上许多东谈主质疑,觉得13.11比13.8大,质疑官方公开作弊。摒除有东谈主挑升搞笑,大致真是有东谈主这样想。

因为小镇拿AI试了一下,问AI们9.11和9.9哪个数更大,适度全宇宙Ai们纷繁翻车,翻车的主若是好意思国的大模子,觉得9.11更大,而中国大模子大齐对了。

其实论断判断错了倒也遣散,问题是许多AI明明逻辑是正确的,也知谈个位数齐是9,需要相比少许点之后的少许,但好意思国的AI们竟然觉得少许点后的11>9,是以9.11更大。

先是外洋的,集体翻车:

色吧性爱

GPT-4o错得很干脆,平直说0.11大于0.9。

GPT3.5Turbo是相同的特地。

2024年6月新发布Claude3.5,还有谷歌的Gemini 1.5 Flash最搞笑,一边说11/100比90/100小,然而又说0.11比0.9大,逻辑也曾绝对乱了。

Sider Fusion跟GPT一个特地动漫区。

精神最紊乱确当属Meta公司的Llama 3。既小又大,归正两个论断齐说了,就差说9.11和9.9相同大了。

惟一正确的是谷歌的Gemini 1.5 Pro,这个版块是1.0 Ultra和1.5 Flash的升级版,终于知谈少许点之后要一位位的比,竟然Flash不愧是“最快的模子”,别管对分歧,快就完事了。

跟集体翻车的好意思国AI们相对比,中国AI靠谱太多了,测试了四个,差异是通义千问、文心一言、讯飞星火、月之暗面的Kimi,除了Kimi齐对了,文心一言还终点强调,少许部分相比要从左到右、每一位齐要进行相比。

天然国产大模子也有虚假的,但总的来说,手脚中好意思两国头部的大模子,国产大模子大多数是对的,与外洋大多数是错的形成了默契对比。

天然毕竟9.11和9.9的相比简直是太容易了,不成因此觉得好意思国的数学水平比中国低,当今AI也照实无边存在近似幻觉率太高的问题,这也导致大模子当今很难运用于实质坐褥,毕竟搞搞翰墨、图片、内容生成,错了就错了,实质坐褥如果出现这种虚假,那问题就大了。

但探讨到AI大模子磨真金不怕火是基于多半的数据,好意思国确天然用好意思国的数据,中国的用中国的数据,那么形成这个虚假,就两个可能:

一是好意思国的大模子存在严重的底层虚假。发现一个蟑螂就意味着有更多莫得发现的,还有若干近似于9.11大于9.9的好笑虚假?这些虚假的存在势必会影响大模子的实质使用。

当今中好意思大模子基于的基础表面是一致的,因此不至于因为基础表面和架构,出现中国大模子不错、好意思国不行的问题。

二是好意思国国民数学平均才智远远差于中国。毕竟进行磨真金不怕火的工夫,不可能只聘任来自精英的数据,大致是好意思国近些年极为无边的看轻理工科诠释、全民反智倾向,导致了这一后果。

天然,以上臆度仅仅一种可能,表面上不至于在这样省略的问题上出现虚假,那么还有一种可能,那等于“草台班子”问题。

但凡在这个问题上出现虚假的AI大模子,建造团队确定平直把数字当文本处理了,天然修起的工夫会提到少许,但实质分析的工夫忽略了少许点,属于极度基础的模子分词虚假。

也可能是某些大模子在处理的工夫,为了检朴资源,平直用了32位单精度以至16位半精度计算,而莫得使用64位的双精度浮点计算。

但不管怎样,中好意思两国的头部大模子,好意思国的基本全错,中国的基本全对,默契好意思国的AI大模子公司需要反想,且看什么工夫这个问题能够获得立异,各公经理当收到了许多适度虚假的响应,如果一周时分还不成处理,那需要反想的就更多了。

从当今看动漫区,至少外洋的大模子AI不太合适作念数学题,照旧别难为AI了。



Powered by 四房色播 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024

创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
JzEngine Create File False