“锵锵!这里是心猿社滴杂务工之‘工具酱’!每日十分钟,最全的AI大事,全知道!”
“别开场了,省流日报,你每多说一个字,就浪费了心猿社辣么多用户整整二字节的流量!”
“嘿!到我这改了还?”
“导播导播,直接开场!”
技术突破(性能&易用性)
Suno v4发布,新增Remaster音质提升和AI歌词助手ReMi【AI音乐·性能突破】
没啥惊喜。
相关资讯:锦上添花,Suno V4 即将来临【AI音乐性能突破·前瞻】
官网链接:https://suno.com/
计算效率领先10倍,中国科大、哈佛功能蛋白质设计深度生成模型登Nature子刊【AI生物研究·性能突破】
中国科学技术大学与哈佛大学医学院合作开发的深度生成算法PocketGen,在蛋白质设计领域取得突破,其效率和成功率超越了诺贝尔化学奖得主David Baker教授的RFDiffusion模型,成为性能最快、成功率最高的蛋白质口袋设计算法之一。相关研究成果发表在Nature子刊上。
相关资讯:https://zhuanlan.zhihu.com/p/7994347436
将上下文长度扩展至百万Tokens!阿里Qwen2.5-Turbo!【自然语言·性能突破】
阿里云最近推出了Qwen2.5-Turbo,这是一个专为长文本场景设计的模型,支持高达100万Token的上下文长度,相当于10部完整小说或30,000行代码。它在Passkey Retrieval任务中实现了100%的准确率,处理速度提升了4.3倍,仅需68秒,并且性价比极高,处理100万Token的费用仅为0.3元。此外,Qwen2.5-Turbo在长文本任务中的表现超越了GPT-4和其他同类模型,同时保持了短文本任务的稳定性。
性能上对标GPT-4,淦,我都想去弄一个了,100万Token,小说吃书神器。
科研方面,可以用“喂资料”的方式来弥补性能上的不足。
官方介绍:https://qwenlm.github.io/blog/qwen2.5-turbo/
在线演示(需魔法):https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo
最大的 AI Agent 生态系统来了,微软推出适配 1800 种大模型的智能体,迈入自己的 Agent 时代【AI社会改造】
微软在芝加哥举行的Ignite大会上宣布,已构建起全球最大的企业AI智能体生态系统,其中超过10万家组织通过Copilot Studio创建或编辑AI智能体,标志着微软在AI智能体领域的市场领先地位。微软允许企业从Azure目录中选择1800种大语言模型(LLM)来构建智能体,并推出了能够独立运作的自主智能体,以促进企业自动化和生产力提升。
相关资讯:https://www.36kr.com/p/3044404292488072
阿里巴巴发布XiYan-SQL,提升NL2SQL准确性【自然语言·性能突破】
阿里巴巴研究团队发布了XiYan-SQL,这是一个创新的NL2SQL框架,它通过融合多生成器集成策略和M-Schema架构表示方法,显著提升了自然语言查询转化为SQL语句的准确性和适应性。XiYan-SQL在Spider测试集中实现了89.65%的执行准确率,并在NL2GQL测试集中展现了41.20%的准确率,确立了新的NL2SQL框架标准。更多信息和项目代码可在GitHub上查看:
相关资讯:https://www.chinaz.com/ainews/13334.shtml
论文链接:https://arxiv.org/html/2411.08599v1
Github项目地址:https://github.com/XGenerationLab/XiYan-SQL/blob/main/README.md
OpenAI ChatGPT网页版上线高级语音模式【自然语言&AI音频·易用性突破】
OpenAI宣布其ChatGPT的高级语音模式功能已扩展至网页版,允许用户直接在浏览器中与AI聊天机器人进行更自然的实时对话。目前,该功能仅对付费用户(包括Plus、Enterprise、Teams和Edu订阅者)开放,未来几周将推广至免费用户。用户可以在网页上通过点击语音图标启动对话,并从九种不同的声音中选择。
相关资讯:https://www.chinaz.com/ainews/13335.shtml
AI能办专属信用卡了,Agent自己赚钱自己花,OpenAI合作伙伴打造
支付公司Stripe推出了一个名为Stripe Agent Toolkit的新接口,允许AI智能体使用一次性虚拟卡完成金融支付,实现自动化购物、订机票等功能。这一工具包支持与Vercel、LangChainAI和CrewAIInc等集成,并兼容任何支持函数调用的大型语言模型(LLMs)。此外,它还提供了实时授权处理、交易监控等控制和监控机制,以确保交易安全。
相关资讯:https://www.thepaper.cn/newsDetail_forward_29387136
Google Gemini推出记忆功能,AI助手更个性化【自然语言·易用性突破】
Google Gemini的新记忆功能允许用户分享个人生活方式和偏好,以实现更个性化的AI回答体验。用户可以在“保存信息”页面添加信息,并指示Gemini在对话中记住这些细节,如素食偏好或语言要求,以便在未来的交互中提供更定制化的服务。这一功能与OpenAI的ChatGPT的记忆功能相似,后者已在多个版本中提供记忆功能,并允许用户控制记忆的开启和关闭。
应该是类似于数据库(知识库),不过是把权重提高了,并且可以在日常对话中记录。
——我没有深度用Gemini,总不会真就是简单的记忆力提升吧…
AI发烧友&Github资讯
适合开发者/程序员等喜欢探索AI的用户哦~
Pensieve开源软件,记录并回忆电脑屏幕内容
Pensieve是一个注重隐私的被动记录项目,能够自动记录屏幕内容,构建智能索引,并提供便捷的Web界面以检索历史记录。它完全由用户控制数据,避免了数据传输到不受信任的数据中心。项目特点包括简单安装、完整的数据控制、全文和向量搜索支持、与Ollama集成以及对任何OpenAI API模型的兼容性。适用于Mac和Windows系统,并且通过插件扩展功能。
就是对屏幕内容进行AI视觉识别,但它是5s截屏一次,嗯…数据量是大大减少了,但是性能和实时记录肯定没得比。
Github项目地址:https://github.com/arkohut/pensieve/blob/master/README_ZH.md
超GPT-4o,1240亿参数!Mistral开源多模态模型Pixtral Large
法国开源大模型平台Mistral.ai发布了1240亿参数的多模态模型Pixtral Large,支持128K上下文,能理解文本、图表、图像等,并在多个基准测试中超越了GPT-4o、Gemini-1.5 Pro、Claude-3.5 Sonnet等模型,成为目前最强的开源多模态模型。同时,Mistral.ai还推出了支持PDF理解、网络搜索、Canvas、AI Agent、图片生成的多模态AI助手le Chat。
相关资讯:https://news.qq.com/rain/a/20241119A00SP600
技术报告:https://arxiv.org/abs/2410.07073
API:https://docs.mistral.ai/api/
开源地址(需魔法):https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411
鉴定网络热门AI事件(陪我一起看资讯吧~)
马斯克预测2026年实现通用AI,对人类未来持乐观态度
埃隆·马斯克在接受腾讯新闻采访时预测,最迟2026年将实现通用人工智能(AGI),并预计人形机器人的数量将突破100亿。他提到特斯拉擎天柱机器人将有重大升级,能够执行接送孩子、教授知识等多种功能,并且成本将低于一辆汽车。马斯克还强调了特斯拉不会涉足手机领域,而是继续专注于汽车和机器人技术。此外,他重申了对自动驾驶技术的信念,认为未来所有汽车都将实现自动驾驶,人形机器人将无处不在。
相关资讯:https://news.qq.com/rain/a/20241120A04G1B00
蜜雪冰城进军AI,成立雪王爱智慧科技
蜜雪冰城宣布进军人工智能领域,成立了一家名为雪王爱智慧科技的人工智能公司,旨在拓展其在AI技术领域的业务。这一举措标志着蜜雪冰城在智能化和科技创新方面迈出了重要一步。
细品一下,这不就是AI监工吗?“通过引入AI技术,将提升餐饮质量监测能力,确保产品的标准化与安全性。”好好好,好好好,AI真爬到打工人头上了(悲…
相关资讯:https://finance.sina.com.cn/roll/2024-11-20/doc-incwsueq5406591.shtml
余承东捂不住了!华为Mate 70真机大曝光,AI功能整大活,自研芯自研系统拉满
华为即将于11月26日发布年度旗舰Mate 70系列手机,该系列将首次搭载原生鸿蒙操作系统,并在隔空交互、多任务操作和影像能力方面带来重大更新。Mate 70系列自11月18日开启预订,预约量已突破234万。华为常务董事余承东还展示了“金丝银锦”配色设计。
相关资讯:https://zhuanlan.zhihu.com/p/7843216675
昆仑万维推出「天工大模型4.0」4o版,实时语音对话助手Skyo上线在即
昆仑万维推出了「天工大模型4.0」4o版(Skywork 4o)和实时语音对话助手Skyo,该助手具备快速响应、多语言对话能力,并能主动发起对话、实时打断,同时拥有情感化反应和个性化声音定制功能。Skyo基于天工AI的大模型技术和AI搜索功能,能够提供智能且贴合需求的互动体验。Skyo预计将于12月份上线昆仑万维旗下天工APP。
相关资讯:https://news.yesky.com/hotnews/61/273561.shtml
买域名花了近一亿!360将发布“AI搜索”
360计划于本月发布一款“颠覆性”的AI搜索产品,旨在打造一个更普及且易于使用的AI工具,以满足用户对AI技术直接、简单的使用需求。公司创始人周鸿祎表示,新产品的命名需以字母N开头,以体现AI概念,并利用其之前购买的域名n.cn。周鸿祎还邀请公众参与命名,一旦采用,将邀请命名者参加发布会。
哇!(呆滞…
相关资讯:https://finance.sina.com.cn/roll/2024-11-20/doc-incwteun2109927.shtml
YouTube新增视频问答功能,增强互动体验
YouTube最近推出了视频问答功能,该功能允许高级会员在视频下方点击“Ask”按钮,直接与AI助手交流,询问关于正在观看视频的任何信息,包括画面内容、播放内容和背景音乐等,AI助手能迅速提供答案,增强了视频观看的互动体验。
不算很重要,毕竟油管需要魔法。
相关资讯:https://t.cj.sina.com.cn/articles/view/1627825392/m6106a4f00330119bq
又一玩家入局,阿里投资的这家AR公司将于明年Q1发布AI眼镜|钛媒体独家
阿里投资的AR眼镜品牌“致敬未知”计划于明年第一季度发布新款AI眼镜,该产品将开辟新的应用场景,与市场上其他竞品形成差异化。致敬未知由前锤子科技合伙人吴德周创立,已完成1000万美元天使轮融资,由阿里领投。AI眼镜市场预计将在未来几年内实现爆炸性增长,成为继智能手机之后的下一个超级硬件市场。
相关资讯:https://news.qq.com/rain/a/20241119A0503U00
工具酱心选文章:
- 苹果防丢神器进化!重塑电视的计划曝光
- 北大90后教授造机器人,一年半就拿了超12亿
- 大模型代肝,自动刷《崩铁》升级材料,Claude操纵计算机还能这么用!
- 大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑
- iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
- 国产4o大模型,秒懂国风李子柒
相关链接
心猿社AI资讯体系(点击链接跳转):
- 最接地气的AI工具工具箱(有工具教程):https://xysai.top/
- 多维频道(有AI工具横向测评):https://huiyuan.xysai.top/forums?index=3
- AI时代研究所:https://flowus.cn/a19d1604-0b5c-4799-a981-ebf43ad60f8b(AI最新发展进程,AI工具榜单,AI思维屋,AI知识夹等)
- AI超级资讯(每日AI日报,AI深度解析,AI发烧友资讯~):https://huiyuan.xysai.top/
- 发烧友面板链接:https://flowus.cn/8a30272a-e488-4648-a52a-6736db92843b
暂无评论内容