微软Copilot Studio新增自定义AI代理功能,谷歌Gemini Ultra上线多模态推理功能

微软Copilot Studio新增自定义AI代理功能,非技术人员可搭建专属助手


微软Copilot Studio平台上线“无代码AI代理构建器”,用户无需编程即可通过拖拽模块创建个性化AI助手,支持对接企业内部系统(如CRM、ERP),已集成至Microsoft 365商业版。


简评:低代码AI代理工具普及将释放中小企业智能化潜力,推动AI应用从“标准化”走向“场景化”,但数据安全与权限管理成关键挑战。


谷歌Gemini Ultra上线多模态推理功能,可解析复杂图文逻辑


谷歌宣布Gemini Ultra大模型新增多模态推理能力,能同时处理文本、图像、表格等混合信息,完成“分析财报图表+总结文字结论+预测趋势”等跨模态任务,已在Workspace套件中灰度测试。


简评:多模态推理是大模型“通用智能”的关键一步,Gemini Ultra的升级或重塑办公场景的信息处理方式,拉开与竞品的技术代差。


Meta开源Llama 3-70B多语言模型,覆盖100+语种翻译与生成


Meta发布开源大语言模型Llama 3-70B,重点强化多语言能力,支持100+语种的文本生成、实时翻译及文化语境适配,模型权重与训练框架完全开放,供全球开发者免费商用。


简评:Meta以开源策略抢占多语言AI生态高地,有望打破英语主导的大模型格局,但需应对不同语种数据质量差异导致的性能波动问题。


智谱AI发布GLM-4V多模态模型,支持8K图像细节理解与视频摘要


智谱AI推出GLM-4V多模态大模型,具备8K分辨率图像像素级理解能力(如识别医学影像病灶、工业零件缺陷),并可对1小时长视频生成结构化摘要,已在医疗、制造领域试点应用。


简评:国产多模态模型在垂直场景的深度突破值得关注,GLM-4V的落地验证了“专用化+高精度”路线的可行性,有望在细分赛道超越国际竞品。


苹果iOS 18.2 Beta集成Genmoji:AI自定义表情包生成功能


苹果向开发者推送iOS 18.2 Beta版,新增Genmoji功能,用户上传照片后,AI可生成个性化卡通表情包,支持调整发型、服饰等特征,计划随正式版向iPhone 15 Pro及以上机型推送。


简评:Genmoji将AI生成式体验融入高频社交场景,增强iOS生态粘性,但需平衡创意自由度与版权保护(如避免模仿真人肖像)。



Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号