这份文档只保存 AI 大模型题目备份清单,方便后续做知识点覆盖、补齐和扩写对照;不放题解答案。
题目清单
1. 什么是词嵌入(Word Embedding)?有哪些常见的词嵌入方法?
中等 | #5097 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
2. 是否使用 Word2Vec 训练过数据?在这个过程中,如何获取语料?如何选择超参数?语料、词表和维度大小如何确定?怎样把握训练时长?
困难 | #5098 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
这份文档只保存 AI 大模型题目备份清单,方便后续做知识点覆盖、补齐和扩写对照;不放题解答案。
中等 | #5097 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
困难 | #5098 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
投了几十家大厂,好不容易拿到一家面试,结果面试官一开口:“你做过 Agent 项目吗?”
嘴巴张了张,一个字也蹦不出来。
我花了三周时间,把牛客、星球里高频出现的 Agent/RAG/Prompt/LLM/MCP 相关面试题全过了一遍,按出现频次 × 难度权重筛出 258 道题目(后面会按照大家的反馈,继续补充)。
这些题目我们会串联到三个实战项目来讲。
在大厂日爆那里看到一则消息,如题。
感觉相当夸张,说明 AI 已经发展到无论是薪酬、制度、还是规则,都跟传统互联网完全不一样了。
另外,从大家反馈的面试来看。
AI 的浓度越来越高,传统的 Java 后端八股比例在逐渐下降,有 7/3 分的趋势。
今天就带着大家过一遍高频的 AI Agent 面试题。

大家好,我是二哥呀。
昨天又高强度肝了一天的 PaiCLI Agent,把整个交互体验又提升了一个档次。
200 刀的 Codex 消耗了 50% 的额度,我只能说终端 CLI 的开发,不管是 Claude Code 还是 Codex,都还缺一块。

缺一块像 use browser 那样直接在浏览器里的调试,有些 bug 的解决必须得人工介入去调查,调查清楚后再引导 Agent 才能解决。
老王今天穿了件黑 T 恤,胸口印着一行白字「My code does compile」,胡子有点拉碴,应该是连续好几天没刮了。
桌上摆着一杯冰美式,估摸着是刚冲的,但一直没顾得上喝。
“我对你要求比较高。”老王开门见山地说,“你,可不要紧张啊。”
(内心OS:哥们也是见过大风大浪的,根本不怕好吧,你尽管来。)

老王就看了一眼我的简历,就开始上压力了:“你不知道现在是 AI 时代吗?简历上连个 Agent 项目都没有,你是怎么敢投 AI 岗的?”
“王哥,你能不能瞪大眼睛仔细瞧瞧。”我直接反击。
老王是真没想到,我敢回怼,立马怂了。
“压力你一下嘛,看你急的。”老王态度 180 度大转弯啊,“简历写得真不错,这恐怕是这一个月来,我见过写得最漂亮的简历了。”

大家好,我是二哥呀。
看到朋友 why 发表的一篇内容特别有意思,关于暗水印的,在职的小伙伴截图的时候一定要注意注意注意。

尽量不要发原图。
可以适当进行一些处理。
比如说用手机拍摄,然后转成单帧 GIF;截图给 AI,写个 HTML 页面复刻截图的内容,然后再截图 HTML。
老王透明的茶杯里,泡满了枸杞,我就瞅了一眼,少说也有 100 颗。
没等我回过来神,老王就直入主题:“你做 RAG 检索用的什么数据库?”
“MySQL。”
老王差点没把刚抿到嘴里的水喷到我帅气的脸上:“就 MySQL?向量检索你用 MySQL?”
“咋了王哥,MySQL 不配拥有向量吗?100 万条 chunk 我照样给它安排得明明白白。”
看老王气急败坏的样子,我笑了:“王哥,逗逗你啦,活跃活跃气氛嘛,这下我不紧张了。向量这块我用的是 ElasticSearch 了,既能做语义,又能做关键字存储,混合检索轻松搞定。😄”
老王 2秒钟翻完了我的简历,推了推眼镜问:“看你精通 Claude Code,你这么厉害咋不手撸一个呢?”
我愣了一下,笑了:“就这?”

接下来的 40 分钟,我从最基础的 Agent 循环开始,一层一层给他拆解了 12 层架构。讲到最后,他说:“现在就办入职手续吧!”
老王是某大厂的一位高级工程师,一头秀发直垂肩背,人不谈不上英俊,但气宇不凡。
他的第一个问题是:“你简历上写的熟悉 Agent Skills,那你说说 Skills 和 Prompt 到底有什么区别?”

瞅着老王的秀发出了神,以至于那一刻我脑子一片空白,支支吾吾说了句“Skills 就是封装好的 Prompt”。