企业生成式 AI 投资回报不佳,95% 无收益
企业在生成式 AI 领域投入的资金已达 300 至 400 亿美元,但麻省理工学院的报告显示,95% 的组织未能从中获得任何回报。仅有 5% 的 AI 试点项目成功创造出数百万美元的价值,绝大多数企业未见显著收益。短期内,生成式 AI的应用不太可能引发大规模失业,其影响主要体现在外部成本优化方面。
百度蒸汽机 2.0 升级,支持多人有声视频生成
百度蒸汽机 2.0 实现了行业内首创的多人有声视频一体化生成功能,突破了此前单人视频生成的局限。该版本推出了多个细分版本,为教育、内容创作等多个领域提供了全新解决方案,标志着 AI 视频生成技术迈入新的发展阶段。
Liquid AI 推出低延迟视觉语言模型 LFM2-VL
Liquid AI 研发的 LFM2-VL 系列模型,在低延迟表现和设备适配性上进行了专项优化。其包含的两个变体可分别适配资源受限环境与高端移动设备,GPU 推理速度较现有模型提升两倍,支持以原始分辨率处理图像以保留细节。该模型开放权重可供下载,适用于研究与商业场景。
智谱 AI 发布 AutoGLM 2.0,语音操控全网
智谱 AI 推出的 AutoGLM 2.0,凭借强大的自然语言理解能力与多平台操作功能,实现了用户与数字世界的无缝交互。它可支持多平台完成复杂任务,还开放 API 接口以融入各类智能设备,有效提升了生活与工作效率。
(图片来自网络)
腾讯元宝接入腾讯视频,可直接跳转观看
腾讯元宝与腾讯视频达成合作,用户可在元宝平台直接搜索影视作品并跳转至腾讯视频观看,支持通过多种方式检索内容,还能与元宝探讨作品背景及剧情,大幅提升了观影的便捷性。
谷歌 Pixel10 系列搭载多项 AI 新功能,领先布局
谷歌 Pixel10 系列对 AI 功能进行了全面升级,搭载了全新处理器与模型,集成了多种 AI 功能。其中 Magic Cue 功能通过 AI 提供上下文建议,重新定义了用户交互体验;语音翻译功能则为商务和旅行用户带来便利,凸显了其在 AI 驱动智能手机领域的领先地位。
微软测试 Windows11 Copilot 新功能,智能搜索文件图片
微软正为 Windows11 Copilot 测试 AI 智能文件搜索功能,支持用户通过自然语言描述检索文件,同时新增家庭体验界面,支持图片分析功能。这些升级提升了文件管理效率,进一步扩展了 AI 在操作系统中的应用范围。
字节跳动发布开源大语言模型 Seed-OSS
字节跳动研发的 Seed-OSS 系列模型,专注于长文本理解、推理能力及开发者友好特性。其中 36B 模型拥有 360 亿参数,上下文处理能力达 512K,提供两个版本选择,并支持 “思考预算” 控制,适用于学术研究与实际开发任务。