互动社区 学术进展 最新新闻

北京大学雷凯:大模型更重要在于工艺

在大数据和强大计算力的时代,众多人都认为,要制造一台出色的大模型,只需大量数据和强大的计算能力。这可能是一个不完全的观点,其实大模型的好坏更多在于优秀的工艺方法,就如同一道美味佳肴,食材和火候同样重要,不同的大厨在相同的原材料上做出的水平就完全不一样。SZCCF舒同学与深圳市ICNLab实验室主任雷凯无意闲聊起这个话题,在本次对话中,探讨了学术、技术、工程和工艺的区别,并提供培养大模型工艺专业人才的五个建议。

  • 学术、技术、工程和工艺四类研究着重点有区别

舒同学: 雷主任,刚才听到你对大模型的观点挺有趣,那能否先请教一下学术、技术、工程和工艺的侧重点区别怎么简单理解?

雷主任: 哈,这是看问题的角度不同,或者是对问题根据属性的分类处理。研究都是面向解决问题,达到一定的目标,这四类研究都很重要,但关注要点有所区别。首先,学术研究注重前沿探索,主要是未来搞清楚未知的东西、希望能从源头创新或者创造新理论、新认知,例如:机器学习一直都在研究,深度学习的原理相对神经网络就是一个新发现;技术,或者说高科技,更多关注对于已初步验证的原理、知识进行实现新方法,推广应用,有效提高生产力,例如大模型AIGC就逐渐成为一个热门的技术领域,大家都希望掌握好,为实际需求服务;工程更多是做大做强,涉及系统开发,例如大模型在垂直行业的应用定制化,是需要很多人力、资源的投入,目前其实已经不太适合科研院所去构建了,更多应该头部企业去重金搭建及优化;工艺在于对传统的方法进行高质量打磨升级(polish),发现方法的有效性窍门,这种是很多次失败、成功、对比总结出来的经验,有点类似“搬砖”,但是“高技术水平的搬砖”,例如为啥菜火太大了,牛排不嫩了就难吃了。

这些技术着重点在应用发展的不同阶段关键性不同,但它们共同构成了科技和产业发展的重要组成部分,目前看,大模型我个人觉得已经进入到比拼工艺强弱方面了,有些独门绝技,是很难从外部去模仿和简单复制的。

北京大学雷凯:大模型更重要在于工艺插图
  • 出现这么大模型发布,到底最终大家怎么PK呢?

舒同学: 现在普遍说大模型是大数据、大算力和大模型算法训练才能一决胜负,是这样吗?

雷主任: 嗯,这些观点都对,只是还不完全。大模型水平高低其实目前看挺神秘的,个人觉得也不要忽视了对更重要的工艺方面的重视。

  • 工艺的重要性

舒同学: 那么,工艺到底有多重要?

雷主任: 想象一下,同样的食材,不同的厨师会做出不同的菜。工艺就像大厨的独门绝技,它能决定最终成果的品质。再比方说发动机,其实你买了车,拿到人家的飞机发动机,可以拆了,就像以前喜欢拆了收音机,好奇为啥它就能听广播、放音乐。但其实最难的还是怎么figure out(搞明白)是怎么一步步做出来。很多企业都有自己的工艺流程商业秘密,大模型都开源了,还是很难追上人家,好像挺烧脑的是吧?

  • 大模型工艺素质能力培养

舒同学: 您说的有道理,那怎样培养懂大模型工艺的专业人才呢?

雷主任: 这是个好问题,也很关键。顺着前面的工艺观点来说,打个比方,金庸老先生的武打小说里面都有武功高手,咱们可以去看看他们成为高手都有哪些关键因数,其实也很简单,一般都有武林秘籍,但更关键的还是内功,哈哈。 因此,我觉得这个赛道要PK脱颖而出,一定不是一拥而上、一朝一夕就能分出胜负的。具体点吧,首先要组合一只多方团队,或者说需要具备多学科知识储备的人才,例如数学、统计学和实践训练,这是基础;其次,深入了解机器学习和深度学习的原理,这是知识能力储备;第三,培养真正耐得住性子,专门从事数据预处理和特征工程的技能专业人才,这是产业能有所大作为的动力。第四,实践中优化模型需要有个成体系的总结归纳的套路,这是如何积累并判断有效的经验。最后,要与行业领域专家及产业深度联手,保持交替反馈和不断调试的状态,才能持续进步。

因此,看起来,能做好这方面的工作,需要有做过大系统、大产品线的统帅及团队才能达标。不瞒你,我感觉真不是一般科研院所能抵得住的。早些年做Maze, 后面就PK不过迅雷,天网搜索后续也PK不过各大搜索引擎,道理很简单,这是大系统工艺,不是简单做个小茶壶,最近不是教育部门再推动高职大学建设么?他们可能重视这方面人才培养可能更对口。

北京大学雷凯:大模型更重要在于工艺插图1
  • 工艺设计人才的培养

舒同学: 对于工艺设计人才,国内为什么也缺乏呢?

雷主任: 这其实是一个跨学科的问题。工艺设计人才需要懂金融、医学等行业专业知识,也需要懂数学、计算方法、机器学习等工作原理。他们是新工科的交叉人才,可以为不同领域的工艺提供更务实的综合能力人才,尤其需要从开始就注重实践训练,好比开车、踢球,训练水平决定后续的比赛成绩,这些都是工艺方面的素养提升。

  • 工艺素质人才的特质

舒同学: 除了技术知识,工艺素质人才还需要什么特质?

雷主任: 他们也需要发现问题、创新思维的能力,就像艺术家一样,创作出独特的作品。同时也可以看到,不是所有人都适合这个领域,就像即使身体素质再好,缺乏对足球、篮球的理解和多维度思维能力,也难以成为高水平运动员,理解一个运动的精髓也是工艺活儿。为啥我一直对大球运动感兴趣,就是它们是一个整体团队协同作战,分工合作才能问鼎,也经常打比方,你有11个梅西组成的球队,也基本可能拿不到世界杯,哈。此外,工艺设计人才需要具备跨学科的知识,能够为不同领域的工艺提供创新视角。不是每个人都适合这个领域,就像不是每个人都能成为高水平的运动员一样。而培养懂工艺的乐意持续坚持的人才及团队终将成为大模型发展的重要推动力。

大模型的成功确实离不开大数据和大算力的支持。但更关键的是多培养工艺技能方面的人才,就像一位熟练的大厨能将同样的食材变出不同口味的菜肴。为了培养懂大模型工艺的专业人才,需要加强基础学科的学习,深入理解机器学习和深度学习的原理,掌握数据处理和特征工程的关键技巧,不断扩充实践内功。

  • 说点区块链、Web3.0

最后再开个玩笑,还比较庆幸早几年转移视线重心关注更多区块链Web3.0这些尚未完全发展的体系结构领域了,更有机会做出一些0到1的Idea (想法)。之前我也做过多年搜索、知识图谱等数据挖掘技术。按照流行语,就是卷不动了,只能权衡利弊做取舍,调整赛道。学校科研课题组的比较合适的状态,是关注一个新兴领域的早期研究。有空也可以多关注ICN区块链这些分布式互联网3.0的基础设施方面的东西,能持续专注一个领域长期坚持是个幸运的事情。例如18年那时候我们提出的智能生态网络IEN,可以说是个冲动的灵感。现在几年下来,我们的技术路线还是有特色的,也延续了十几年NDN方面的研究。体系结构是个整体设计问题,也是个不断改进升级的工艺工作,相比大模型大规模工艺工作,这些好像我们还能Hold得住,浩大的巨大成本投入的科研个体户确实高攀不起,哈。

舒同学:哈哈,说得也是,谢谢雷老师分享,我们也还是都憧憬这些大科技变革时代最终可以有更多自主可控的大发展,普惠受益。

雷主任:对的,一同努力,一同期待,谢谢。

延伸阅读:

  1. 《区块链风险更复杂多样,需要建立标准与监管共识》,2017年1月,胡润金融科技大会,深圳
  2. 《区块链:阿凡达文明的缔造之魂,信息中心网络:潘多拉世界砥砺之基》,2018年3月,CCFYOCSEF,深圳
  3. 《IENII:知识驱动的边缘智能生态网络设想及初探》,2019年5月23日,南京未来网络大会
  4. 《智能生态网络:知识驱动的未来价值互联网基础设施》,应用科学学报,2020年1月
  5. 《面向边缘人工智能计算的区块链技术综述》,应用科学学报,2020年1月
  6. 互联网3.0新书 《区块链导论》— 郑纬民院士、李晓明教授作序 – 知聊机器人社区 (bosombot.com)

视频纵览:

  1. 《块游记:区块链如何与NDN等未来网络基础设施结合》,2018年11月,CCF区块链大会,杭州
  2. 《IEN III:5G边缘算力网络》,2020年6月,南京未来网络大会
  3. 《IEN 3.X:区块链与命名机制在未来网络体系结构中的先进原理》,2021年6月,南京未来网络大会
  4. 《IEN 2021:基于价值数据NFT的开放可信数字底座》,2021年11月,4th Hot ICN,南京
  5. 《IEN 2022——面向Web3.0的内容中心链网底层基础设施》,2022年11月,5thHot ICN,广州

Related Posts

AI教父Hinton最新采访万字实录:ChatGPT和AI的过去现在与未来缩略图

AI教父Hinton最新采访万字实录:ChatGPT和AI的过去现在与未来

文章引自:https://mp.weixin.qq.co…

强化学习中的Transformer发展到哪了?清北等发布TransformRL综述缩略图

强化学习中的Transformer发展到哪了?清北等发布TransformRL综述

选自arXiv 作者:Wenzhe Li等 机器之心编译…

ChatGPT幕后的真正大佬……缩略图

ChatGPT幕后的真正大佬……

原文链接:https://www.toutiao.com…

简单说明一下GPT的来源和构成以及前世今生缩略图

简单说明一下GPT的来源和构成以及前世今生

原文链接:https://www.toutiao.com…

朱嘉明:智能数字新时代,AIGC与ChatGPT的13个关键问题缩略图

朱嘉明:智能数字新时代,AIGC与ChatGPT的13个关键问题

原文链接:https://mp.weixin.qq.co…