将本站设为首页
收藏祭司官网,记住:www.jsshengmin.com
账号:
密码:

祭司书院:看啥都有、更新最快

祭司书院:www.jsshengmin.com

如果你觉得好,恳请收藏

您当前的位置:祭司书院 -> 股海弄潮 -> 第384章 17岁,跨洋代码

第384章 17岁,跨洋代码

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

  2024年7月25日,星期四,晚上八点。

深圳,默石资本,技术部。

暑假已经过半,技术部的灯比平时亮得更晚。陆方坐在工位上,面前是三块屏幕,每块都显示着密密麻麻的代码和模型输出。他正在测试星海大模型模块的准确率——89%,比上个月提高了1个百分点,但离90%的目标还有差距。他有些沮丧。不是因为他不够努力,是因为他觉得自己可能走错了方向。大模型的发展太快了,每个月都有新论文,每个月都有新模型。他追不上。

手机震动了。是陈曦发来的消息:“陆方叔叔,我这边是早上。你那边应该是晚上吧?吃饭了吗?”

陆方回复:“还没。在调模型。”

陈曦:“什么模型?”

陆方:“星海的大模型模块。准确率卡在89%,上不去了。”

陈曦:“你有没有试过开源模型?比如LLaMA、Falcon、Bloom?我用它们在伯克利的服务器上做过测试,准确率能到92%。”

陆方愣了一下。他当然知道这些开源模型,但他没有试过。因为他的思维还停留在“自己训练模型”的阶段,没有想过用现成的开源模型做微调。这就是代际差异——他这一代人,习惯从零开始造轮子;她那一代人,习惯站在巨人的肩膀上。

陆方:“我没试过。你能帮我跑个测试吗?”

陈曦:“可以。你发我一份测试数据集。”

陆方从星海平台导出100份招股书摘要和对应的分析报告,打包发给陈曦。数据集不大,几百兆。

陈曦:“收到了。我明天给你结果。”

陆方:“好。谢谢。”

陈曦:“不客气。”

2024年7月26日,星期五,上午十点。陆方收到了陈曦的测试结果。她用了三个开源模型——LLaMA-7B、Falcon-7B、Bloom-7B——在伯克利的服务器上做了微调。结果让陆方震惊——LLaMA-7B的准确率最高,达到91.5%,比星海大模型模块的89%高出2.5个百分点。Falcon-7B达到90.2%,Bloom-7B达到89.8%。三个模型的平均准确率90.5%,超过了星海。

陆方看着那个数字,沉默了很久。他想起自己花了三个月时间调参数、优化模型,准确率只提高了1个百分点。陈曦只花了一个晚上,用开源模型微调,就把准确率提高了2.5个百分点。不是他


  本章未完,请点击下一页继续阅读!
上一页 12345下一页

看了《股海弄潮》的书友还喜欢看

贪财好你
作者:青沅
简介: 恋爱前的傅铮:有钱有权的投资圈大佬。恋爱后的傅铮:怒撒千金只为博心上人开心。
更新时间:2026-03-03 23:44:26
最新章节:第137章 不是出成果了吗
长生修仙:从薅妖兽天赋开始
作者:廿三声
简介: 再睁开眼,林长珩降临危险的修仙界,宗门林立、世家割据,邪魔横行、妖兽乱世。
...
更新时间:2026-03-03 23:26:00
最新章节:第425章 越国现状,结婴内幕;正魔倾轧,终得混入
御兽之我真不是天才
作者:风和穗
简介: 【女强+无cp+万兽迷】开局穷得叮当响,差点就带御兽去吃土。好在半道觉醒,面板诞生。...
更新时间:2026-03-03 22:06:00
最新章节:第二百四十六章 一区天骄
长空战旗
作者:康斯坦丁伯爵
简介: 3000小时空战游戏时长的王礼被扔到了一个气态巨星表面的世界,这是个所有人都生活在飞...
更新时间:2026-03-03 23:00:00
最新章节:第87章 可怕的约瑟芬(求月票)
美利坚:从街头流浪汉开始肝技能
作者:人比西瓜瘦
简介: 马杰克穿越到洛杉矶街头,一没身份二没工作,只能被迫成为一名拾荒者。

更新时间:2026-03-03 23:09:00
最新章节:第351章 童话故事与黄毛辣妹
死亡回档,48小时拯救世界
作者:稻香锅巴
简介: 一场车祸,让王聪获得了

“死亡回档”的能力!?\n正当他准...
更新时间:2026-03-03 23:37:32
最新章节:第241章 方牌线索!