中国大模型企业如何存活？中美差距如何缩短

发布日期：2024/1/15 9:53:21 浏览：46

优秀提问奖获得者左起刘嵘、郑烨婕、汤瑭、吴毅凡、侯志伟、张洁瑶与台上嘉宾合影

【导读】2024年1月8日，数字强国系列第六讲即163-6以《2024：开启数字与智能经济的融合时代》主题作为收官之讲，邀请知名经济学家、横琴澳粤深度合作区数链数字金融研究院学术与技术委员会主席朱嘉明做同名主旨发言，上海智慧城市发展研究院院长盛雪锋、上海人工智能实验室大模型生态总监许劭华、东方财富人工智能研究院首席科学家刘志毅应邀展开对话。10位听友参与互动，上海树图区块链研究院研究总监、Web3专场主讲嘉宾杨光博士参与提问点评。50位现场听友获得本期NFT数字藏品。

本期讲座由文汇报社、上海树图区块链研究院共同主办，文汇报视频号、喜马拉雅·听视频直播，上报集团融媒空间技术运营团队技术支持。

现经整理，分主讲、对话、提问三篇刊发讲座内容。此为提问篇。

垂直大模型成本在降低，逐步优化或是生存更优选择

上海联通公司职员刘嵘：中国涌现出大量的大模型企业，大多在C端应用。在B端应用上，存在训练成本高、推理成本高以及私域数据难管理、存储私密性的门槛，中国的大模型企业该如何存活？

盛雪锋：你说得很对，大家都在做大模型，很多企业号称在做通用大模型，其实并不通用。

第一，对普罗大众的企业来说，它们的机遇在垂直类大模型，比较坚定地推进本行业甚至本企业垂直领域的模型构建，应该是对未来较好的投资。

第二，据我们监测和观察，投资成本正在快速降低，以至于能力较弱的企业也能承受投资资本。比如上海某知名的人工智能企业开发布会时表示，由它们基础底座大模型训练新的垂直领域的模型，成本约为十万人民币。所以，稍微有点规模的企业都能承担这点成本。

第三是数据。很多大模型本身训练得很好，并不像大模型刚兴起时需要海量训练体量。有些学校把科研成果拿出来也能训练出与它自己适用的大模型，逐步优化完善会是更好的选择，而不是一次性找到大量数据求一蹴而就。

*亟需建立区域级大模型实验室，定出分类标准精准开发

线上提问者获得了需要在区块链应用上存放的163-6期的NFT数字藏品。背景版显示了6期所有的NFT数字藏品设计，由李洁等设计，此时尚体验为本系列讲座的亮点

朱嘉明：目前大模型并没有分类，所以比较杂乱。因此，现在要加快对大模型分类，无论是通用型、偏通用型，还是偏垂直领域，都需要有一套衡量体系，确定参数内涵。

在制定标准过程中，要注意如何衡量大模型效益的发展潜力，大模型的硬件体系，以及大模型之间的接口。现在，大模型似乎处于群众运动阶段，很多模型都会自生自灭，浪费很多资源。在上海这样的发达地区，当务之急是建立区域级大模型的实验室，形成对所有大模型和C端B端或G端结合的评估模式。

大模型出现，劳动本身变成消费、贡献和生活方式

复旦大学马院在读博士生汤瑭：AI大模型能否替代人类的情感劳动？如不能替代，AI大模型如何与之进行有效互动，从而既有利于自身的升级进步，又做到劳动者合理的价值分配？

朱嘉明：事实上，在进入上世纪工业化社会后，劳动这一概念已被反复更新和改变。到了数字时代中后期以及智能时代，劳动进一步蜕变，劳动本身就变成了消费、贡献和生活方式。在智能时代，劳动会从形式到内容都发生实质性的变化，更多人因为大模型卷入到人工智能特定劳动状态。例如，网红每天制作的小视频过程也是劳动，只是这个劳动会与消费结合。

AI已位于新基建的核心位置，大模型需求呈乐高化

上海市外国投资促进中心杨峥臻：在人工智能发展如此受到世界关注的今天，上海若希望在AI产业获得更好的发展，从投资促进的角度看，可以做些怎样的工作，营造怎样的生态环境？

朱嘉明：过去几年，加密数字货币、Token、NFT、DeFi、区块链、元宇宙、Web3、DAO等，从不同方面在强化数字时代创新。但是，所有这些技术，最后还是被算力和算法所控制。例如，与元宇宙不可分割的数字孪生，虚拟人的设想，理论上没有障碍，但实际做不到，技术上不足以支撑。今天，因为人工智能，这些过去做不到的事现在有可能实现。

因此，因为人工智能，导致了过去的创新进入到收敛过程，并且可以通过人工智能联结在一起。所以，现在要强化数字和人工智能创新的基建结构。过去谈新基建结构时，并未把人工智能放在核心位置，今天人工智能处在核心位置。

大模型就是复杂和多维的矩阵。可以这样想象：未来的大模型会乐高化，即不同的大模型之间有分工，加上垂直模型，构成乐高排列，每个企业或政府不可能依赖于一个模型，它需要通过若干模型支持目标和前景。

让大模型辅助基础科研不能一蹴而就，短期不高估长期不低估

华东理工大学在读博士生侯志伟：技术的本质是技术的组合，技术的基底是现象，让AI走进实验室去识别新的现象（图像识别）加之AI的分析能力，这是否意味着AI会具有人的创新能力？AI参与实验积累之后接入现有知识数据库，是否可产生新知识或新技术？

许劭华：用AI识别科研领域的多种数据元素，可属于AIforScience研究范畴，它显示出几个典型特征，一是它涉及到的元素都非常复杂，从标注到解读的门槛都很高，二是领域中可用于训练的数据较少，因为自然科学中没有那么多数据，也无法简单地生成。

技术新生事物往往遵循这样的规律，不要过高预估它短期成效，但不要低估它长期的成效。科技新生事物往往遵循这样的规律：初期，需要投入很多专业人员给予数据准确的标注，并不断调整优化算法。一旦具有合适的场景、合适的数据驱动之后，它会具备有很强的归纳能力和推理能力，能带来科研方向上明显的加速。

这里要强调的是，它不是一蹴而就的，即便找到了足够多的数据，研发了适合的算法，也无法完全代替传统的科研，它需要做基础科研人员与AI的研究人员共同合作，AI未来会为科学研究带来更多可能。。

上海具备人才、技术优势，要善用新政策创新业态、新型企业

华东理工大学商学院经济学研究学者蒋士成：什么样的经济制度更适合智能时代的发展？上海应该发挥哪些制度优势来发展人工智能产业和经济？

朱嘉明：人工智能，包括今天反复讨论的大模型，确实是非常前沿的突破。从历史的角度看，它是过去许多原来比较成熟的技术的组合。组合不一定先进，但先进一定来自组合。在今天，上海需要持续创新和创造，核心是不断完成突破和前沿科技的组合。这是个巨大挑战。

每个时代都会发生两种情况，一方面是因为有新技术、新思路，或者有新观念，改变和改组原来的经济形态；另一方面，基于这种新技术来创造全新的企业。上海足够大和人才相对比较丰富，可以实现双向优势，既拥有对传统产业行业和企业的改造能力，也具备创造全新产业的可能性。

上海面临的挑战是，如何凭借这样的基础产生新的企业。目前为止，在AI垂直领域中，到底爆发了哪些新企业？第一类行业是AI写作工具，如JasperAI等已成为新兴行业，许多从未听过的代表企业横空出世，融资数亿美金。第二类行业是AI思维导图工具行业，包括PPT、模板、扣图等，这些行业开始只有数十人，但发展极快。现在唱歌、绘画、舞蹈、音乐都有世界级企业。

上海在这方面极具潜力。问题是由谁组织、推动，有怎样的政策支持，让这些新型企业像雨后春笋一样产生。现在技术已很成熟，资本并非短缺，关键还是要有人和团队。

在任何历史阶段，实体经济很重要，但不要把未来发展局限于实体经济的范围之内。实体经济需要人工智能化，现在要产生全新的与人工智能相关的新型企业和新型行业，已刻不容缓。

中文在大模型语料中占比较少，亟需全社会共同思考解决方案

退休教师方洛克：您今天的演讲中提出很多耳目一新的关键词，包括生态、或然率、硅基人类和乐高化等，极具前瞻性。我前不久参加亚马逊生态训练，训练中使用中文很难通过，必须要用英文。请问如何从竞业上构建生态？

朱嘉明：因为大模型，推动知识图谱和语料发育，涉及到哪种自然语言比重更大。目前，在大模型的训练中，占第一位的语料和真正直接相关的自然语言是英文，中文的比重与我们在全球人口中的比重并不一致。

从长远来看，自然语言在大模型中的差距会变得更加严峻。因为训练自然语言的数据越多，发展越快，失衡也愈加严重。现在，人工智能最大的困难是，大量新概念已经来不及或没有能力翻译成汉语，大量缩写无法表达。这是亟需正视和解决的挑战之一，全社会不仅要关注，而且要寻求较好的解决方案。

既要承认与美国的十年差距，也要对未来超越持有信心

华理附中高中生吴毅凡：在智能领域，中国企业进步极快，但某些核心技术还受制于人，尤其在算法、算力和芯片上。您觉得我们还需要多久可以突破核心技术？

刘志毅：关于核心技术的中美差异，过去近十年时间，AI创新源头仍然来自美国，虽然国内总体论文数量有所增加，但源头性的论文数量以及质量有80来自于海外，这个层面的差距仍然较大。

如何追赶和何时追上？

第一，AI在应用上已经产生了分化，同样的源头，通过开源扩散到中国以后，因为芯片的策略和数据的关系，应用的场景产生了两个世界的分化：美国互联网与中国互联网，美国产业与中国产业。

第二，对于我们能否追赶和超越，我仍然持有非常大的信心。2000年时，美国NASA（美国航空航天局）发布政策，阻止所有与中国有关的研究者进入其中参观并学习；但2023年，NASA局长说中国人不允许美国参加中国项目是很保守的行为。这种前后态度的反差，以及中国在相应技术上的突破，都存在一个过程。这个时代很像4G时代电信运营商所做的工作。那时中国制定标准，做TDCDMA但做得不好，几年后华为研发了5G、6G，并制定了5G的全球标准，占据了一半以上的专利，有了极大的改变。

我们既要承认现实中中美之间有十年左右的差距，也要看到未必二十年后我们就不能定义下一代通用AI的标准。中国研究者并不缺乏原创性精神，当下亟需我们做的一件很重要的事情是，与数学家、与不同领域技术科研工作者一起合作工作，二十年后必然能看到新的革新和变化。

AI时代边际成本与规模关系不大，但成本上升加剧了竞争

东方财富职员郑烨婕：大模型的边际效益大于边际成本的恒纪元（编辑注：《三体》中提出的一种时代，意味着大地复苏、生命成长）什么时候来临？

朱嘉明：有两个思路，工业时代边际成本只要形成规模，边际成本一定下降。例如，制鞋制造到一定规模边际成本下降。进入到人工智能代，人工智能的每一个技术都是动态的，与规模无关，边际成本未必一定下降。

如果假定大模型比较稳定，期构造、参数、技术体系不变，只是重复使用，边际成本是下降的。事实上，大模型需要不断迭代。例如ChatGPT5在路上，可能马上就会公布，虽然它的技术透明度很低，可以绝对相信，会超过第4代。当它上升一个台阶之后。当大模型更新，其的边际成本会是上升的。如此导致大模型竞争的残忍性。其硬技术成本也要上升，芯片进入到10纳米以下，成本急速上升，到现在的3纳米和2纳米，成本和价格都已经超出人们的想象。

在严格意义上，当前科技发展的边际成本是在上升，它使得科技竞争变得尤其激烈。在高科技时代，成本还不仅仅是指资本成本，还有人的智商成本、教育成本、团队成本。

上海智慧城市建设三维度：整体性、全方位赋能以及革命性

中间者为张洁瑶

上海政法学院教师张洁瑶：伟大一定来自整合，请问上海智慧城市建设过程中的整合路径规划是怎样的？

盛雪锋：上海一直走在智慧城市路径上，而且经历不同的阶段，每个阶段有不同的思路和具体推进策略。从目前来看，上海在城市数字化智能化发展上，也有一些比较好的切入点，主要三句话。

[1] [2] 下一页

上一个上海：上海立信会计金融学院搜索引擎和流媒体代理投放服务公开招标公告
下一个上海：上海继续优化楼市政策，奉贤、青浦有条件放松限购

你可能会喜欢