在 obsidian 里面使用 ai 插件实现语义搜索和关联笔记展示
在 obsidian 里面使用 ai 语义搜索和展示不同笔记相似度是一个很不错的功能。这次使用 Similar Notes 插件(官方插件市场)基本实现了,过程中有点曲折,这里记录一下。 首先此插件作者就对语义模型做了推荐说明:“For Chinese, Japanese, and Korean text, multilingual models like bge-m 3 (via Ollama) often outperform OpenAI models in both quality and token efficiency.“也可以使用自带的 paraphrase-multilingual-MiniLM-L12-v2 模型,考虑到本来就有 ollama 而且 bge-m 3 性能自然更好,于是我这里选择 bge-m 3 进行语义理解。 bge-m 3 说是专为中文/多语言设计,上下文长度是 8192 tokens(约 6000 字中文),所以还不错。 使用 ollama 安装之后,在插件里面选择,开始 index,发现很多报错,研究之后认为是很多笔记几千字,超出了上下文长度。 这存在问题,笔记虽长,但还没到 8192 tokens,和 ai 讨论后认为是 ollama 配置覆盖了模型默认参数 bge-m 3 的 8192 tokens 上下文是模型能力,但 Ollama 会强制限制上下文长度,可以使用下面指令查询: ollama show bge-m 3 --modelfile # 查看实际配置 我这里输出发现就是 Modelfile 中缺少关键参数 :PARAMETER num_ctx 8192 ...