每日必读
OpenAI发布首个AI智能体Operator,可控制电脑【AI助理/性能突破】
OpenAI于2025年1月23日发布了其首款AI智能体Operator。Operator能够像人类一样使用浏览器,独立完成各种在线任务,如预订机票、酒店、购买杂货等。该智能体目前以“研究预览版”形式在美国上线,首批面向ChatGPT Pro用户,未来将逐步推广到其他版本。Operator背后的核心技术是CUA模型,结合了GPT-4o的视觉功能与高级推理能力。OpenAI还与多家科技公司合作,确保Operator在这些应用中顺畅运行。
HeyGen推出数字人运动控制功能:能弹乐器还能跳舞【AI视频/性能&易用性突破】
HeyGen发布了数字人运动控制功能,实现了虚拟形象的复杂肢体动作操控。该技术突破使得数字人不仅能够完成基础的微表情,还能流畅地执行弹奏乐器和舞蹈表演等复杂动作,动作响应延迟降低至12毫秒,极大提升了视频制作效率。
Perplexity推出Android移动助手:可写电子邮件、预订晚餐【AI助理/性能突破】
Perplexity于2025年1月24日推出了一款名为Perplexity Assistant的Android移动助手。该助手具备多模态交互能力,能够回答问题、撰写邮件、设置提醒、预订晚餐等。它还可以通过摄像头识别物品或场景,并支持与Spotify、YouTube、Uber等应用的交互。目前,该助手仅支持Android平台,未来可能会扩展到其他平台。
元象推出智能数字人平台「元象日播」
元象信息科技有限公司于2025年1月24日推出了智能数字人平台「元象日播」。该平台具备高自然度定制能力、实时交互功能和一键开播特性,能够快速搭建专业直播空间,并通过自研大模型实现观众互动。平台支持音色克隆和全头全脸驱动技术,用户可上传少量音频素材实现高度定制化的数字人形象。此外,平台还支持将直播内容一键推流至美团、抖音、淘宝等主流平台。目前,元象日播已广泛应用于本地生活团购、娱乐、餐饮、医疗等行业,显著提升了客户的销售转化率。
百川智能发布全场景深度思考模型Baichuan-M1-preview
百川智能发布了全场景深度思考模型Baichuan-M1-preview,该模型同时具备语言、视觉和搜索三大领域推理能力。它在数学、代码等多个权威评测中的表现可对标o1-preview,并解锁了“医疗循证模式”,能够快速、精准地回答医疗临床和科研问题。此外,百川智能还推出了行业首个开源医疗增强大模型Baichuan-M1-14B。
Hugging Face推SmolVLM模型:小巧智能,手机也能跑【需魔法】
Hugging Face推出了一款名为SmolVLM的轻量级视觉语言模型。该模型体积小巧,仅需20亿参数,即可在手机等小型设备上运行,同时性能超越了需要大型数据中心支持的前辈模型。SmolVLM的推出标志着AI技术在设备端推理的新突破,降低了企业的计算成本,推动了AI应用的普及。
- 从本土到全球,雷神科技布局十年,打响出海第一枪
- 阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节
- 贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行
- Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
- 向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling
- 帮村里接通AI就靠它!34个地域超拟人AI智能体上线,背后技术也被我们扒出来了
- 自由画布第一波实测,边玩边把DDL列表清空了
- 强如Operator也怕验证码,1450元花得值吗?OpenAI智能体8年3次尝试之路
- 国内首发!跃问App上新「创意板」功能,无痛自制应用+游戏,强代码能力支持,说出灵感即可实现
- 英矽智能登Nature子刊:利用量子-经典混合模型设计新KRAS抑制剂
中国联通发布元景思维链大模型:性能超越GPT-4
中国联通于1月18日发布了元景思维链大模型,这是央企首个开源的通用思维链大模型。该模型具备强大的“慢思考”能力和多场景推理能力,能够在不同任务和难度下自适应调整。在主流榜单测评中,其性能超越了OpenAI的GPT-4。
鉴定网络热门AI事件
一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek
国外软件工程师安纳奈·阿罗拉以极低价格购买了OGOpenAI.com域名,并将其重定向至中国AI实验室DeepSeek。DeepSeek的AI模型在某些基准测试中表现优于OpenAI的o1模型,而OpenAI则因未能及时发布强大模型而受到行业批评。
OpenAI CEO宣布ChatGPT免费版将引入o3-mini,效率翻倍
OpenAI首席执行官Sam Altman宣布,ChatGPT的免费版将升级为全新的o3-mini模型,旨在提升用户体验并满足日常需求。该模型将为免费用户提供更快的响应速度,同时付费用户将获得更多使用机会。
暂无评论内容