第9章第一次组会_科研系学霸

    第9章第一次组会 (第2/3页)

写代码只能说是整个科研过程中最为简单的一个步骤了。

    接下来才是折磨的开始。

    跑实验——>调BUG，这种枯燥的循环过程才是真正让人感觉心累的环节。

    周昀在网上找了一个参数量在100B左右的大模型，本来他是打算找个几十B的就差不多了。

    谁知道导师这么给力，资源多了，他也不那么扣扣嗖嗖了。

    AgileEdge的主要作用就是将大模型压缩成小模型然后放到边缘设备里。

    因为是全自动的AI框架，所以其操作流程非常的傻瓜。

    只要将边缘设备连接到电脑，程序就会自动检测其硬件的具体参数，然后经过AgileEdge的压缩，不断地优化模型，最终形成一个能运行的模型文件。

    边缘设备周昀暂时就找了一台老的智能机，内存只有32G，将手机插上数据线。

    运行程序。

    一个进度条出现在屏幕下方。

    【预计时间：17h】

    “就知道。”

    只要涉及到大模型，实验的时间就不会短，不过十几个小时也算快了，前世周昀曾经一个实验跑了两周，主要就是当时的服务器实在太垃圾了。

    三天后，周五。

    经过几天的实验，周昀的AgileEdge算是初步能用，但是距离他预想的性能，还有一些差距。

    而且不同的大模型之间，压缩后的性能也存在较大的差距。

    他的想法是在模型压缩的同时，性能不变，但是现在看来，模型压缩，性能就一定会变差，这看上去似乎是一个无解的问题。

    周昀能保证，自己的AgileEdge框架是没有问题的，不然也不可能实现模型压缩，那么有问题只可能是模型本身。

    大模型本身特殊的架构，限制了其参数的数量。

    简单来说就是，无论如何压缩，其总是会存在一个下限，而周昀要做的就是突破这个下限。

    这就不得不对模型本身进行修改。

    “看来之前还是想简单了。”

    智能化修改大模型架构，又是一个不小的工程，就这个研究，都够发一篇A会了。

    就在周昀思考的时候，群里

    （本章未完，请点击下一页继续阅读）

第9章 第一次组会

第9章第一次组会