面壁智能创始人刘知远谈大模型竞争:知识密度成关键
清华大学副教授刘知远在WAIC2024分论坛上分享了关于大模型技术发展的见解。他表示,从2023年下半年开始,中国的一线大模型公司已经达到了GPT3.5的水平,现在已经接近GPT4.0的水平。但是,更值得关注的应该是国外尚未公布的模型。未来,高效大模型的发展关键在于知识密度。模型的知识密度增强将呈现出每8个月提升一倍的规律。OpenAI推出的ChatGPT标志着通用人工智能的开启,其影响力类似于2000年互联网兴起时的水平。在未来5-10年内,大模型和通用人工智能技术将为整个产业和人类社会带来无限的想象空间。刘知远还指出,大模型技术将会朝着更加科学化的方向发展,并且未来大模型的发展主要会在企业端、产业界和高校等领域展开。他还提到了未来大模型竞争的核心将是知识密度的竞争,这意味着每次计算所需的参数规模将越来越小,从而提高模型的效率和准确性。