再补充个问号,象征这件事尚未有最终定论就可以了。
但在诸多前车之鉴下,任谁看了这张图,也都会觉得蓝影魅踪是又被打脸了。
——
“你们是怎么做测试的!?怎么会发生这种问题!?”刘安临偷眼看了一眼玛德琳和罗伯特李那铁青的脸色,对傅远生厉声斥责。
傅远生和那三个研究员满头大汗。
“这、这……可能是数据没有完全覆盖,我们马上做针对性调校。”傅远生擦了擦额头的汗珠,他怎么也想不到,已经监督学习了这么久,怎么还会出现这种问题。
“‘汤婆婆’的资格是谁发放的?你们事先不去做任何审核吗?”刘安临面色狰狞的冲傅远生咆哮道。
此前他和康洋茗共同主导了江米网的收购,已经给千寻造成了巨大的损失。如果不是玛德琳保他,他可能早就被干掉了。
AI战略,是玛德琳给他的最后一次机会,如果这次再出问题,他在千寻的路就走到头了。
不,不止如此。
刘安临脑中闪过玛德琳把u盘给他时的表情。
必要的时候,自己一定会是被扔出去背锅的那一个!
玛德琳?玛德琳现在根本就不是千寻的员工!
做出什么样的决策,最后当然就是业务负责人的责任!
不行,我也得找个替死鬼,这个傅远生看上去傻乎乎的,就选他了!
“公测名单是公关部给的啊。”傅远生叫屈,“刘总你当时不是还转了他的微博了吗?”
傅远生虽然不知道自己已经快要成为白金之星的同类,但生物的先天危机感还是让他能推卸一分责任就往外推卸一分。
汤婆婆的公测资格确实是千寻给的。
任谁看,这个ID此前发的东西都是千寻的铁杆水军。
发的都是诸如罗伯特是大厂中唯一具有真正的工程师精神的老板。
古狗创始人以前是罗伯特学生。
当年古狗退出根本和千寻没关系,那时候千寻早就一家独大。
竞价排名是所有搜索类网站共同的业务,给古狗贡献的营业额比千寻多。
千寻在AI领域有无数技术储备。
贴出最近实锤伊丽莎白霍姆斯的Theranos公司造假新闻对照柚子科技的炒作历程说明小公司都不靠谱。
贴出方豫的专业,质疑金融学专业的学生怎么可能开发出AI,相信的人智商是不是有问题。
将柚子科技在github上的项目摘抄下来几个,和千寻公布的一些技术牵强附会,说这家公司就是靠一路抄袭千寻的技术走到的现在。
汤婆婆的这些言论,在真正专业的人看来简直不值一驳,他们都能从github和arxiv上看出柚子科技的技术成长路线。
并且柚子框架和橘子大模型的适配度与底层逻辑的相似性,就足以证明橘子大模型是柚子科技自主研发的。
但以汤婆婆为首的这群水军,根本不跟你做理性分析,就是揪住某些似是而非的疑点穷追猛打挖苦讽刺。
手段之卑劣,言辞之恶毒,让千寻公关部都觉得这个水军找的可太值了,战斗力之凶猛,简直就是肘子二代。
公关一号位前天甚至给这个“汤婆婆”发了一笔单独奖金。
因此,汤婆婆申请测试资格的时候,毫无障碍的就通过了。
“够了!”玛德琳面若冰霜,眼神中传出阴冷的杀气,“现在不是追究这些事情的时候!现在的问题是,公测还要不要继续!怎么继续!?”
“傅远生!修复这个问题还要多久?修复后还有没有可能再出类似的问题?‘闻君一言’中会不会还有类似的bug?”
傅远生心说我怎么知道还有没有?
我还是把橘子大模型想象的太简单了!
傅远生心中充满了后悔,早知道就不接这个活儿了。
他此前做的也是NLP方向,对LSTM和RNN非常熟悉。
这个时候的LSTM,一般来说都只有几百上千万的参数,能过亿的非常非常少。
神经网络的层数,大多也只有三四层,他们目前结合了残差网络后做的最深的LSTM也只有10层的深度。
原本他想的是,就算橘子大模型有他不了解的网络结构,肯定差异也不会太大,对照柚子科技发布的论文,怎么也能看的懂。
可谁能想到,他拿到手的橘子大模型,足足有60层的深度!
而且,每一层中,又会含有数层不同的神经网络结构,没有一层是他熟悉的网络结构,其中的机制他到现在都没搞明白。
60层1500亿的参数啊,他们是怎么做到的?又是怎么用现阶段的算力来支撑的?
这么深的神经网络,怎么控制梯度爆炸的?怎么控制过拟合的?怎么控制信息的稀释丢失的?
因此,傅远生所能做的,就是修改了橘子大模型的名字和版权信息。然后不停地给大模型做学习训练,用海量数据将橘子大模型原有的数据覆盖。
要比数据,尤其是周文数据,千寻可是谁都不怕的。
这样做,大概率是比不上原本橘子大模型的性能的,但谁在乎?
只要能引导舆论,黑的也能说成白的,臭的也能说成香的,那么多流量明星都能做的事情,我千寻怎么可能做不到?
可谁能想到这么一个公测版的大模型里,居然还有彩蛋呢?
这个彩蛋为什么没有被学习了这么多次的数据覆盖?
第277章 你很得意是不是(看作者的话)-->>(第2/3页),请点击下一页继续阅读。