DeepSeek 的崛起以及中国开权重大型语言模型(LLM)的出现,为马来西亚带来一次跨时代的机遇。但政策是否能跟上技术发展的步伐?
作者:Dr. Pieter E. Stek,亚洲商学院高级讲师
亮点
全球 AI 发展的转折点 —— 也是马来西亚的机遇
今年1月,DeepSeek-R1大型语言模型(LLM)的问世,标志着生成式人工智能(AI)技术发展的重要里程碑,从技术、商业与政治三个层面都具有深远意义。DeepSeek 证明了先进的 LLM 模型可以以极低的成本训练完成,而且这种技术突破不再局限于硅谷。
虽然这对中美科技竞争格局具有战略意义,并导致马来西亚股市数据中心概念股迅速降温,但 DeepSeek 的崛起对马来西亚 AI 生态的影响远不止于此。
开源 AI 的战略意义
首先必须指出,DeepSeek 的语言模型大多基于开源技术,例如 DeepSeek-R1 模型要么是开源的,要么是“开权重”的(open-weight),这意味着任何人都可以下载并自由修改它们。
开源特性对 LLM 的技术路径和商业前景具有重大意义。
中国的科技企业,如百度、阿里巴巴和腾讯,多年来一直致力于开源 AI 模型的研发。其战略得到了中国高校和政府的支持,可被视为一种“开放创新”模式,目的是加速研发进程并实现对美国的技术“弯道超车”。
然而,投入开源 AI 的不仅是中国企业。Meta 和 Google 也出于竞争考虑推出了开权重的 LLM 模型。
开源策略:打破技术垄断的经典打法
在科技行业中,“商品化补充品”(commoditize the complement)是一种常见的颠覆策略。如果企业是生成式 AI 的大量用户,与其依赖专有模型(如 ChatGPT),不如投资开源替代品。即使仍需使用专有模型,开源模型的存在也削弱了供应商(如 OpenAI)的定价权。
Oracle 就曾采用类似策略。作为服务器和网络设备制造商,Oracle 支持开源的 Linux 操作系统,以此削弱微软 Windows 系统的市场垄断地位。
无论出于何种动机,如今高质量的开权重 LLM 已经面世,这意味着马来西亚可以前所未有的低成本接触最先进的 AI 模型。
国家数据主权的新机遇
对政府而言,这意味着可以在不向商业第三方或外国转移敏感数据的前提下,自主运行 LLM,增强数据自主权。
对企业而言,开源 LLM 让初创公司与中美企业站在了同一起跑线,极大提升了本地企业的竞争力。
超越接入权:文化本地化的紧迫性
然而,中国 AI 的崛起也暴露出文化适配的问题。中国的 LLM 模型被普遍认为是按照中共版本的历史和政治观点进行训练,从而符合中国大陆的审查制度。
即使模型本身并未被有意“审查”,其训练数据也带有特定文化和价值观的偏见。如果训练文本以英文为主,那么模型自然会呈现西方文化视角。
幸运的是,LLM 的后训练(post-training)相对容易。正如中国的 LLM 可以通过后期训练贴合中共意识形态,已有开源项目表明 DeepSeek-R1 同样可以通过后训练剔除其原有的文化偏见。
为什么本地 AI 能力至关重要?
对马来西亚这样的国家来说,这一经验再次凸显出建设本地化 AI 能力的重要性——从训练到微调,再到文化适配。如果 LLM 无法识别马来西亚的多元种族与宗教敏感点、社会层级或本地俚语,不仅会降低性能,甚至可能生成有害内容。
目前,马来西亚已经显现出一定的本地 LLM 能力。例如,初创公司 Mesolitica 于今年1月发布了开源语言模型 MaLLaM,它对马来语的理解明显优于 ChatGPT 等主流模型。
马来西亚政策制定者的黄金窗口
然而,目前尚不清楚马来西亚的政策制定者是否充分认识到开源 AI 的潜力,以及本地开发 LLM 的战略意义。
国家 AI 路线图几乎未提及开源 AI,这一情况可以理解——毕竟路线图发布于“遥远”的2021年。但即使是新设立的国家 AI 办公室(NAIO)发布的文件,也鲜少关注这一话题。
虽然我们无法准确预测 AI 的下一阶段发展,但当前 LLM 的开源特性,为马来西亚缩小与科技强国之间差距提供了千载难逢的机会。
开源 AI:马来西亚实现技术平权的利器
为了把握住这个历史机遇,马来西亚应尽快调整政策,迎接小型化、低成本 LLM 的新时代。这不仅能推动更广泛的模型采用,还可将生成式 AI 技术带入中小企业,乃至网络基础设施薄弱的乡村地区。
此外,马来西亚应扩展自身的 LLM 开发能力,使模型更贴近本地语言与文化。将 LLM 训练视为一种公共产品,并依托本地高校进行投资,有助于培养本地人才并推动研发进步。
最后,马来西亚应自主部署 LLM 模型,以确保国家数据主权。LLM 能收集大量有价值的信息,这些信息应掌握在本地组织手中,而非被外国公司所用。
亮点
编辑说明:
本文原题为《马来西亚准备好了吗?抓住中国开源 AI 革命的契机》,作者为亚洲商学院高级讲师 Dr. Pieter E. Stek。
他的研究聚焦于亚洲的创新体系、数字基础设施及科技地缘政治的演变。本文所表达观点仅代表作者个人立场。如您希望投稿,或分享有关 AI、政策或亚洲商业创新的见解,请联系 NewInAsia 编辑团队。
Read the English article here, or listen to the podcast here.