
图:受“日日新语言大模型粤语版”推出刺激,商汤股价大涨近5%。
人工智能(AI)软件公司商汤科技(00020)昨日面向企业用户推出“日日新语言大模型粤语版”(简称“日日新粤语版”)应用程序界面(API),并计划于7月1日推出“SenseChat粤语版”及“商汤企业级大模型一体机”。商汤表示,“SenseChat粤语版”的网页端及手机应用程式将永久免费开放给香港个人用户,并称其较OpenAI的ChatGPT4更熟悉粤语及香港文化。受消息刺激,商汤股价昨日升4.58%,收报1.37元。/大公报实习记者 蒋梦宇
商汤科技首席执行官徐立指出,生成式人工智能大模型需要融合广泛的基础知识,因此面临地域文化的差异。他认为,大模型的应用落地需要服务于本地文化,故推出“日日新粤语版”填补本地市场空白。
未来拟进军多语种市场
商汤管理层指出,香港作为以中华文化为主的多元文化社会,具有多语言环境的复杂性及文化的多样性,为语言大模型训练带来了极大的挑战。商汤香港业务总经理冯愈表示,SenseChat粤语版在原有大模型的基础上利用约6B Tokens的数据进行粤语训练,其中收录不同年代的香港俚语、俗语,包括时兴的“潮语”及香港特有的中英混用表达习惯,又称输出内容会确保“老少皆宜”。
冯愈表示,考虑到仍未见其他大模型进入粤语市场,料商汤产品在香港市场可取得领先地位,此前已与来自金融、医药及建筑等垂直行业及特区政府的部门进行沟通。他透露,日后有意前往多语种市场,如新加坡、泰国及马来西亚,发展针对小语种的大模型。
建AI计算中心需三项条件
关于AI行业的监管及风险问题,冯愈表示,目前市场发展空间大,处于供不应求的阶段,商汤首要任务是加大算力,并指若在香港建设人工智能计算中心(AIDC),则需要解决电力、人才及土地不足等问题。徐立则表示,跨时代科技所带来的产业发展往往无先例可循,重新定义行业的过程中必将伴随模式的来回探索、持续的大规模技术投入,以及商业模式的打磨。
经过迭代更新,是次发布的粤语大模型在知识、推理、数学、代码等方面的表现均对标ChatGPT-4 Turbo。发布会上,商汤利用粤语俗语、港星照片及地标建筑展示了“SenseChat粤语版”的理解、思考、生成的能力。该产品目前已具备文字及语音交互功能、多模态文档功能,及粤语的文字转语音及语音识别功能,并支持上载最多50个文档。据商汤称,“日日新粤语版”API的价格是目前全网旗舰大模型最便宜,输入及输出费用均为每100万Tokens(词元)只需30元。
是次发布会,商汤与德勤中国、香港电讯(06823)及隶属于吉利科技集团创新业务板块的长兴吉数科技签署合作备忘录。各方将在SenseChat粤语大模型应用、市场开拓、人工智能服务应用及算力资源等方面探讨合作。