返回

第157章 橘子大模型(第二更)

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
性要高得多。

    “找到了!”没过多久,柚子就发出了振奋的声音。

    “《带注意力的序列到序列》中提到的注意力机制模型与位置编码技术和LSTM、CNN、FFN等神经网络的结合,可以形成新的框架,经过训练后添加其他模型,可以形成目前测算中效率最高的大模型。”柚子迅速在方豫的电脑屏幕上投出了相应内容。

    “我会把这些模型放到我自己的框架内,由我的框架进行重组。”

    说着,柚子身上的银色星光逐渐变成了一条缓慢流转的光带,这是柚子在用自己的本体帮助阵列服务器进行辅助运算,再把辅助运算的结果传输至服务器网络。

    只要找对了路,柚子的运算能力远非现如今任何一台超级计算机所能相提并论的。

    不过三分钟,身上流淌的银色光带便重新变回了点点银色星光。

    “框架重组完成,底层法则添加完毕,上传服务器系统后进行初次学习。”柚子平铺直叙的声音传来,似乎变了一个球,跟电影里的人工智能一样。

    方豫不为所动搓了搓手指:“好好说话!”

    柚子明显一激灵,语气谄媚:“主人,大概还要30秒,新的框架就能上传至服务器,其后就可以做模型数据训练了。”

    话说着,体积并不大的框架模型已经完整上传至服务器机组,服务器内的柚子分身就开始往新框架中添加处理过的数据。

    12组GPU服务器、196颗TeslaM60算力全开,服务器的散热风扇以一万五千转的速度旋转着,将热量排至这不足五十平米的空间中。

    “目前已完成40GB的数据清洗,现在开始用这部分数据进行第一次训练,这个模型需要30万步的迭代可以完成收敛,预计将耗时3小时21分。”

    随后,方豫的屏幕上出现了一个3小时21分20秒的倒计时。

    方豫搓了搓手,在屋子里走了两圈,心情既期待又激动。

    如果这个模型经过数据训练,能够表现出一定的分析处理能力和交流能力,就意味着,自己真的搞出了一个可用的人工智能大模型!

    你说是柚子搞的?

    屁,老子是通讯作者懂不懂?

    确定研究方向、划分研究阶段、指导研究内容,老子干的就是导师的活儿。

    

第157章 橘子大模型(第二更)-->>(第2/3页),请点击下一页继续阅读。
上一页 回目录 下一页 存书签