第9章 第一次组会 (第2/3页)
写代码只能说是整个科研过程中最为简单的一个步骤了。
接下来才是折磨的开始。
跑实验——>调BUG,这种枯燥的循环过程才是真正让人感觉心累的环节。
周昀在网上找了一个参数量在100B左右的大模型,本来他是打算找个几十B的就差不多了。
谁知道导师这么给力,资源多了,他也不那么扣扣嗖嗖了。
AgileEdge的主要作用就是将大模型压缩成小模型然后放到边缘设备里。
因为是全自动的AI框架,所以其操作流程非常的傻瓜。
只要将边缘设备连接到电脑,程序就会自动检测其硬件的具体参数,然后经过AgileEdge的压缩,不断地优化模型,最终形成一个能运行的模型文件。
边缘设备周昀暂时就找了一台老的智能机,内存只有32G,将手机插上数据线。
运行程序。
一个进度条出现在屏幕下方。
【预计时间:17h】
“就知道。”
只要涉及到大模型,实验的时间就不会短,不过十几个小时也算快了,前世周昀曾经一个实验跑了两周,主要就是当时的服务器实在太垃圾了。
三天后,周五。
经过几天的实验,周昀的AgileEdge算是初步能用,但是距离他预想的性能,还有一些差距。
而且不同的大模型之间,压缩后的性能也存在较大的差距。
他的想法是在模型压缩的同时,性能不变,但是现在看来,模型压缩,性能就一定会变差,这看上去似乎是一个无解的问题。
周昀能保证,自己的AgileEdge框架是没有问题的,不然也不可能实现模型压缩,那么有问题只可能是模型本身。
大模型本身特殊的架构,限制了其参数的数量。
简单来说就是,无论如何压缩,其总是会存在一个下限,而周昀要做的就是突破这个下限。
这就不得不对模型本身进行修改。
“看来之前还是想简单了。”
智能化修改大模型架构,又是一个不小的工程,就这个研究,都够发一篇A会了。
就在周昀思考的时候,群里
(本章未完,请点击下一页继续阅读)