专栏

当前位置/ 首页/ 要闻频道/专栏/ 正文

商汤发布日日新5.0大模型,全面对标GPT4 Turbo

导读 4月23日下午,在2024年商汤技术交流日上,商汤科技正式发布“日日新0”大模型,该模型采用MoE混合专家架构,基于超过10TB tokens训练...

4月23日下午,在2024年商汤技术交流日上,商汤科技正式发布“日日新0”大模型,该模型采用MoE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,知识、推理、数学、代码全面对标GPT-4 Turbo。

文章转载自:界面新闻网 非本站原创

免责声明:本文由用户上传,如有侵权请联系删除!