序言
哈喽,这里是心猿社主播六六六(顿…),这样开场没问题吧(小声)?
哦哦!如你所见,这里是[AI自然语言·入门指南],你也可以称之为”通用AI”。
本篇旨在为小白提供一个[完整了解AI自然语言,使用自然语言AI工具的渠道],如果你并非小白,出门左转,进入大玩家…咳咳,不好意思,看错稿子了。自然语言没有[大玩家指南],下一级就是科研专精进阶,因此看完本篇,你就直接是【金丹期】修士了!
嗯,闲言少叙,现在开场(激昂!
AI自然语言工具能做些什么?
AI自然语言大模型,顾名思义:“即使用自然语言数据训练的大模型”,代表性的有Chatgpt,Deepseek,豆包,Kimi等…
最基础的功能是“
向AI工具输入要求,例如:写一篇“五言古体诗歌”,你就会得到:
山川披锦绣,江河岁月长。
鸟语花香里,心旷神亦怡。
登高望远景,怀古思悠扬。
世间繁华事,尽在笑谈中。
就是这么简单,你可以尝试输入任何的要求,随你所想。
这是一个进阶的功能,将“AI模型”与“搜索引擎”相结合,当你输入要求,AI模型还会从网络上为你搜索资料!
例如:“杜甫编入初中高中课本的故事有哪些?只告诉我诗歌名称。”你就会得到:
杜甫编入初中高中课本的诗歌如下:
高中课本:《登高》《登岳阳楼》《蜀相》《客至》《秋兴八首・其一》《咏怀古迹(其三)》
初中课本:《江南逢李龟年》《望岳》《春望》《石壕吏》《茅屋为秋风所破歌》《月夜忆舍弟》
优点很明显:没有广告,答案简洁。
缺点可忽略:出现错误信息的概率增加,不过这更受模型质量的影响。
不得不说,你很幸运,因为AI自然语言已经发展得相当成熟,语言通话,PPT制作等好用的功能层出不穷!我们将其称为“易用性”,打开心猿社[横向测评·接地气榜单],向下翻即可查看!
![图片[1] | [AI自然语言·入门指南]必修课!本篇老玩家也建议观看! | 心猿社](https://huiyuan.xysai.top/wp-content/uploads/2025/01/20250125111433280-image-png.webp)
如何挑选AI自然语言工具?
工欲善其事,必先利其器。第二步便是挑选好用的AI工具。鉴于现在AI处于发展前期,所以心猿社开设了双榜单来帮助你进行选择:
这是新手村的必备!我们从用户的角度出发,根据实际使用环境【论文;PDF阅读;PPT制作等…】,进而筛选出了最好用的AI工具!
其次是[最新进程]AI的发展,通通打包!。这里记录了AI的发展进程,每个事件我们都会进行人工核实!通过这个板块,你可以快速了解到AI绘画领域发展到了什么程度,有什么前瞻的功能即将上线!
最后,你也可以通过AI金选工具箱快速访问相关工具!它和[横向测评·接地气榜单]全面联动,只有榜单更新,工具箱就会更新!
而本教程也会【动态更新】,但因为入门教程的特殊性,所以更新具有滞后性——因此更推荐大家关注工酱姐姐负责的【AI省流日报】,那里不仅包含了每日的AI事件,心猿社的维护更新也会在那里发布!
有的靓仔可能会说,那只需要[最新进程]即可了呀?!实际上,许多AI工具所谓的更新,升级,有时还没有实装在AI工具上,或者是需要用API调用,有一定的门槛。而[横向测评·接地气榜单]中,只会记录真正实装的工具!
AI自然语言·拓展知识
玩家宝典
提示词,想必你听过不少次这个名称,实际上没什么神秘的,你输入的文字,就叫提示词。例如:写一篇“五言古体诗歌”。
作为我们和AI自然语言工具沟通的唯一桥梁,提示词至关重要。例如:写一篇“诗歌”和写一篇“五言古体诗歌”是存在差别的,AI生成的结果自然不同。
接下来是Token,这个词你可能会很陌生,但务必
在AI中,Token用“词元”来解释更为合适,它指的是自然语言处理过程中用来表示单词或短语的符号。这样说可能有些拗口,我们打开https://platform.openai.com/tokenizer(需魔法)做个示例。
![图片[2] | [AI自然语言·入门指南]必修课!本篇老玩家也建议观看! | 心猿社](http://huiyuan.xysai.top/wp-content/uploads/2025/01/20250125123350100-文章渲染图.webp)
![图片[3] | [AI自然语言·入门指南]必修课!本篇老玩家也建议观看! | 心猿社](https://huiyuan.xysai.top/wp-content/uploads/2025/01/20250125123854163-文章渲染图.webp)
所以你会发现:AI居然不会数数!那是因为在狭义上可以说:“自然语言=中文=字符”,你的要求是让AI说出“字符”数量,“可AI并不知道一个token里面的实际文本,它只是学到了每个token的内在含义、与其他token的关联”。
“比如说,它学到了cat代表一个物种、喜欢吃fish、很cute,但它很难学习到cat有三个字母这件事情,因为这需要它的训练语料包含这个知识:The word “cat” has 3 letters.”(翻译:“猫”这个单词有三个字母。)
“这种情况下,你再让模型去数“aaaaaaaaaa”有几个a就比较难为人了,因为它必须知道“该Token”代表8个a。”
此外,不同的AI模型,其Token包含的字符数也不同。例如:同样字数的输入,A模型可能会换算成“100个tokens”,而B模型会换算成“120个tokens”。有关字符和Token的换算规则,这一点需要翻阅官方文档。
好了!从这里便可以窥见AI模型的秘密了,而心猿社·AI小白研究教程的第一篇章便会从这里入笔!
最后,通过这篇内容你要学习到的最核心的知识是:
- https://zhuanlan.zhihu.com/p/711236601
- https://zhuanlan.zhihu.com/p/696192942
除了“提示词”和“Token”,AI自然语言中还有许多必备的词汇,你可以点击AI自然语言知识·导航板进行查看。
此外,我们还准备了心猿社金选/必看知识·导航板,有空可以看看,这些知识非常重要哦!
尾言
好啦!现在你已经成为了合格的【金丹期】修士啦噜!
暂无评论内容