这个工具有问题吗?

关于「去除 HTML 标签 在线」

该工具从文档中删除所有 HTML 标签,只留下纯文本内容。它正确处理嵌套标签、自闭合标签、注释、脚本和样式块(连同其内容一起剥离),以及 HTML 实体(解码为字符形式)。

在仅希望从网页复制内容文字时、从 HTML 源准备电子邮件或 SMS 文本时、将 HTML 通过期望纯文本的下游工具传递时,或对用户提交的富文本进行清理以安全存储时非常有用。

该工具提供保留块级元素换行的选项(使段落保持分隔),以及在需要部分标记时保留某些标签(如 <a> 或 <strong>)的选项。

如何使用这个工具

如何去掉所有标签,从 HTML 中提取纯文本

  1. 粘贴 HTML

    把 HTML(整页或片段)放入「HTML」字段。`<p>`、`<a href="…">`、`<br>` 等会被剥掉,仅保留它们之间的文本内容。属性值不会保留——只留下可见的正文文本。

  2. 点击运行

    结果只有 `text`:连续空白会被压缩;块级边界处(`<p>`、`<div>`、`<br>`)的断行被转为换行符,使输出有可读的段落结构。

  3. 不会处理的情况

    `<script>` 与 `<style>` 的内容会被清空。内联事件处理器(`onclick="…"`)会随属性一并消失——无需担心。`&amp;` 这样的实体会被解码:`&lt;` 变成 `<`。

  4. 用在哪里

    从 HTML 模板生成纯文本邮件正文;统计已发布文章的字数;把富含 HTML 的输入喂给只接受文本的工具。如果需要保留语义(链接、列表),改用 `html-to-markdown-converter`。