机器文摘第 122 期

被勒索软件加密的文件有破解可能吗？

用 GPU 解密被勒索软件加密的文件，作者最近帮助一家公司从 Akira 勒索软件中恢复了数据，而无需支付赎金。为此专门写了一篇博客，分享他是如何做到的，以及完整的源代码。

这篇文章深入探讨了如何利用 GPU 破解 Akira 勒索软件（Linux/ESXI 2024 变种）加密的文件，无需支付赎金。文章首先介绍了 Akira 勒索软件的背景，指出该变种使用当前时间（纳秒）作为种子进行加密，且每个文件都有唯一的密钥。作者通过分析恶意软件的代码和加密原理，发现可以通过暴力破解时间戳来恢复文件。

文章详细描述了暴力破解的可行性、实施步骤以及相关代码和工具的使用。作者还分享了如何获取明文样本、测量服务器速度、划分工作负载、租用 GPU 等实用信息。此外，文章还提供了恢复文件的具体步骤，包括获取时间戳、密文和明文，以及如何运行暴力破解和解密工具。

作者在文中强调了这一过程的复杂性和挑战性，同时也分享了成功恢复文件的经验和教训。

文章最后指出，虽然大多数勒索软件情况下无法在没有密钥的情况下恢复数据，但有时通过深入研究和分析，仍有可能找到解决方案。

大模型核心概念科普文：Token 是什么?

Token 是什么?

Token（标记）

定义：文本处理的基本单位，1个中文≈1 Token，1英文≈0.3 Token 作用：模型通过Token处理文本，直接影响上下文长度计算 2. 上下文长度（Context Window）

定义：单次推理可处理的输入+输出Token总量上限（如DeepSeek为64K≈6万字）特点：多轮对话需拼接历史记录，超出限制时触发"上下文截断"（丢弃早期内容）实际使用中服务端自动截断，用户感知为模型"遗忘"早期对话 3. 最大输出长度

定义：单次生成内容的最大Token数（如DeepSeek为8K≈8000字）输入限制：上下文长度 - 最大输出长度 = 最大输入限制（如64K-8K=56K）典型场景策略

短输入长输出：输入1K时最多输出63K（需质量检测）长输入短输出：输入60K文档时最多输出4K摘要多轮对话管理：通过截断保留最新内容（如累计64K时新输入5K，则丢弃最早5K）技术原理

受三大因素限制：位置编码范围（如RoPE、ALiBi）自注意力机制计算复杂度 KV Cache显存占用与序列长度正相关厂商对比

OpenAI GPT-4：上下文128K，输出4K Anthropic Claude 3：上下文200K，输出4K DeepSeek：上下文64K，输出8K 使用建议

长文本生成需分段请求关键信息尽量放在对话后期敏感场景主动设置max_tokens参数重要内容建议本地存储避免依赖模型记忆（注：文中数据以DeepSeek模型为例，不同厂商参数存在差异）

智能体设计引擎

Parlant，这是一款对话式 AI 引擎，它利用行为指南、运行时监督等，让开发人员能够控制面向用户的 AI Agent。

来源：@karminski-牙医。

相信大家都打过移动客服，客服会根据你按的数字键进入下一个对话。这个工具的功能类似，你可以预设用户的提问，然后针对每个提问场景来编写功能，比如是RAG查询还是调用函数去给客户订票等等。

估计企业客户会对这个框架比较感兴趣，用来搭建自己的智能客服。

像素级精度复制任何UI界面

Same dev，宣称可以以像素级精度复制任何用户界面（UI），只需提供网页 URL、截图或设计文件（如 Figma），即可生成对应的代码，确保视觉效果与原始界面高度一致。

通过 AI 驱动，网页链接将 UI 转化为可运行的代码，支持多种前端技术栈。

支持的框架包括 HTML/CSS、React、Tailwind CSS 等

为大模型提供浏览器自动化能力的工具

Playwright MCP Server，通过模型上下文协议（MCP）服务器，让 LLM 可以与网页交互、截取屏幕截图、在真实浏览器环境中执行 JavaScript，实现智能 AI 网页浏览和操作。

主要功能：

为 Claude 等 LLM 提供浏览器自动化能力
支持与网页交互、表单填写和导航操作
能够截取网页截图，帮助 AI 理解网页内容
支持在浏览器环境中执行 JavaScript 代码
集成 Smithery 和 mcp-get 等工具，简化安装配置

让大模型操作 Blender 自动建模的工具

BlenderMCP，一个通过 MCP 实现 Claude 直接操控 Blender 的开源项目：BlenderMCP。

只需简单的提示词，即可让 Claude 控制 Blender 自动进行 3D 建模、场景创建和模型操作，实现 AI 辅助 3D 内容的创作。

主要功能：

双向通信：Claude AI 可直接与 Blender 进行实时交互和控制
对象操作：创建、修改、删除 Blender 中的 3D 对象
材质控制：应用和修改材质与颜色属性
场景检查：获取当前 Blender 场景的详细信息
代码执行：从 Claude 在 Blender 中运行 Python 代码

提供简单的安装步骤，需先安装 uv 包管理器，然后将插件添加到 Blender 中，并在 Claude 设置中配置 MCP 服务。

然后输入：“创建一个低面数地牢场景，里面有一条龙守卫着一锅金子”，Claude 就能直接控制 Blender 创建完整的 3D 场景。

一个开源的 MCP 客户端工具

Open MCP Client，能让我们轻松地在任何应用中与 MCP 服务器进行交互的客户端，只需从 Composio 获取一个 URL 即可快速连接。

主要特性：

基于网页的 MCP 客户端，可直接在浏览器中使用；
开源客户端库，可轻松集成到任何应用程序中；
使用 CopilotKit 构建客户端和交互层；
集成 LangChain LangGraph ReAct 智能体协调 MCP 调用；
仅需 40 行代码即可实现 MCP 服务器的连接功能。

感兴趣的可以部署在 Vercel 平台上，或者直接访问给出体验链接，也可以选择集成到自己的应用中使用。

LLM 微调教程

Fine-tuning Guide，一个指南来教您如何正确地微调 LLM！

主要内容：

选择正确的参数和训练方法
RL、GRPO、DPO 和 CPT
数据准备、过度拟合和评估
使用 Unsloth 进行训练并在 vLLM、Ollama、Open WebUI 上部署

网易云音乐无损解析开源工具

Netease_url，只需复制粘贴歌曲链接，即可解析各种音质，包括超清母带、沉浸环绕声等高质量音质，并可打包下载歌曲文件、封面图以及歌词等。

主要功能：

支持多种音质解析，从标准到超清母带全覆盖；
提供 GUI 模式和 API 模式两种使用方式；
自动打包封面图和歌词，一次下载全部资源；
可通过命令行参数自定义音质和解析方式。

机器文摘 第 122 期

被勒索软件加密的文件有破解可能吗？

大模型核心概念科普文：Token 是什么?

智能体设计引擎

像素级精度复制任何UI界面

为大模型提供浏览器自动化能力的工具

让大模型操作 Blender 自动建模的工具

一个开源的 MCP 客户端工具

LLM 微调教程

网易云音乐无损解析开源工具

订阅

机器文摘第 122 期