首页 | Menghuan1918's Blog

对于大多数开发者和重度互联网用户而言，浏览器中打开数十个标签页是常态。一些小Tips和插件能极大幅度提升浏览器使用效率，尤其是在有大量标签页时的浏览器默认配置下的使用问题。

Menghuan1918原创2025/10/9大约 2 分钟

本文旨在Arch Linux中配置完善的字体，同时在最小化安装外部包，不影响性能，同时尽可能简化配置的情况下美化KDE的外观。

最终效果在不影响视觉的情况下尽可能添加透明效果，同时混合Windows和MacOS的操作逻辑，最大化显示区域的同时保证了操作效率。

Menghuan1918原创2024/12/8大约 5 分钟

对于模型而言，其超参数设置好坏可以显著影响其性能。然而显然手动调整实在有些折磨，我们可以使用一些工具来进行自动调整模型超参数，例如本文使用的ray.tune进行调整。其仅需要在原本的代码上改动十几行即可开始自动调整(个人认为比NNI更简单易用一些)。

Menghuan1918原创2024/11/24大约 5 分钟

以往博客都是直接将文件粘贴到文件夹，但是其不是很方便，并且也不方便转移(到其他平台上)。最后综合几个选择，选择自建 MinIO 当作图床，同时也实验一下 MinIO 的文件压缩功能。

Menghuan1918原创2024/11/23大约 2 分钟

最近因为毕设，在研究对于AI系统攻击手段。以下是一些浅要简短的研究的综述了，主要是关于计算机视觉以及NLP的较新的对抗性攻击手段。

Menghuan1918原创2024/11/6大约 5 分钟

目前的Fastgpt，Dify(或者其他同类产品)，目前知识库召回的本质上还是分片块的文本，召回的还是文本信息。不过，我们可以进行一些预处理，提升其召回精度的同时，使其也能同时召回将图片与公式表格等内容。

Menghuan1918原创2024/8/16大约 6 分钟

巨硬最近新出了个 graphrag ，号称其能提取有意义的结构化数据，不过遗憾的是默认情况下其只能读取txt或者csv数据。这次就让我们用~~我搓的~~外部库pdfdeal将PDF转换为带格式化的txt，再结合更便宜的deepseek进行构建。

Menghuan1918原创2024/6/26大约 17 分钟

使用gpt_academic + searxng搜索，进行网页或者学术论文的快速检索。实验下来使用~~超级便宜的~~deepseek-chat也能有相当好的效果。不过由于要处理的文本量偏多，原版的llama3处理这种任务就有点力不从心了，可能需要使用上下文更大的本地模型才能有更好的效果。

Menghuan1918原创2024/6/26大约 3 分钟

UV，作为新一代的，性能极佳的Python的包安装器和解析器，其网上中文教程却寥寥无几...

由于其目前并不支持自行下载多版本的Python，这篇文章记录下我借用conda的多版本Python支持，与uv结合，使得能实际使用中完全替代conda。

也算半个UV使用教程了把(大概)。

Menghuan1918原创2024/6/6大约 4 分钟

记录下运用Dify + xinference + ollama打造带重排序(Rerank)步骤的知识库问答，更好的是----即使在我的3060M上其也能完全本地运行并有不错的效果！3060M本地运行llama3-9B的生成速度参照前文。

Menghuan1918原创2024/5/31大约 3 分钟