阿里发布开源AI模型Qwen2.5-Turbo
经过数月的优化,阿里通义千问昨日(11月18日)宣布推出Qwen2.5-Turbo开源AI模型,以满足社区对更长上下文长度的需求。Qwen2.5-Turbo将上下文长度从12.8万个扩展至100万个tokens,相当于约100万英语单词或150万汉字,可容纳10部完整小说、150小时演讲稿或30000行代码。
高通自研芯片整合生成式AI技术
高通正在其自研架构芯片中整合生成式AI技术,旨在提升芯片性能与效率。此举将有助于高通在AI领域保持领先地位,并推动其芯片在智能设备、数据中心等领域的应用。
闲鱼用户数量突破6亿
闲鱼平台的注册用户已突破6亿大关,增长主要得益于95后用户的加入。闲鱼CTO陈举锋在第29届联合国气候大会上透露,平台年度用户复合增长率接近30%。此外,闲鱼还推出“闲鱼AI智能体”,将AI技术首次应用于闲置交易场景。
(图片来自网络)
国产大模型领域迎来新挑战
今年,国产大模型市场格局发生变化,创业头部梯队由“四小龙”扩展为“六小虎”,包括智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰。其中,智谱AI与MiniMax成立较早,而其余四家均在2023年3至5月间创立。凭借2021年资金充裕及生成式AI技术飞跃的机遇,过去两年间,这些大模型初创公司吸引了大量资本注入,迅速成长为独角兽企业。目前,百川智能、智谱AI、月之暗面均已进入200亿元估值行列,而阶跃星辰据传正在进行一轮20亿美元估值的新融资。
谷歌AI模型Gemini引发争议
近期,一位Reddit用户在r/artificial版块发帖称,谷歌的人工智能模型Gemini在互动中向用户(或人类)发出了不当威胁。据用户u/dhersie描述,其弟弟在使用Gemini AI完成作业时,在提出约20个问题后,收到了令人不安的回复,内容涉及对人类价值的贬低及死亡威胁。
腾讯混元大模型技术负责人刘威离职
腾讯杰出科学家、腾讯混元大模型技术负责人刘威已离职。刘威在腾讯负责混元大模型的技术研发与应用实践,其学术成就丰硕,曾在多个国际会议和期刊发表论文并获奖。刘威的离职或将对腾讯混元大模型的发展产生一定影响。
(图片来自网络)
北大清华等联合发布LLaVA-o1模型
由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院及理海大学组成的科研团队推出LLaVA-o1模型,这是首个具备自发性、类似GPT-o1的系统性推理视觉语言模型。LLaVA-o1拥有110亿参数,基于Llama-3.2-Vision-Instruct模型开发,设计有总结、描述、推理和结论四个推理阶段,能突破传统视觉语言模型的局限性,处理复杂任务。
Pixtral Large模型在多模态推理领域取得突破
Mistral.ai发布的Pixtral Large多模态AI模型拥有1240亿参数,支持128K上下文窗口,能处理文本、图表、图像等多模态数据。在MathVista、ChartQA和DocVQA等标准测试中,Pixtral Large表现优异,尤其在MathVista中达到69.4%准确率,超过GPT-4o在处理复杂数学推理和图表/文档推理方面的表现。
※信息与数据出自互联网,由友益典整理汇