将特殊字符转换为 HTML 实体 htmlspecialchars

(PHP 4, PHP 5, PHP 7)

htmlspecialchars — 将特殊字符转换为 HTML 实体

说明

htmlspecialchars(string $string [, int $flags= ent_compat | ent_html401 [, string $encoding= ini_get("default_charset")[, bool $double_encode= true ]]]): string

某类字符在 HTML 中有特殊用处,如需保持原意,需要用 HTML 实体来表达。 本函数会返回字符转义后的表达。 如需转换子字符串中所有关联的名称实体,使用htmlentities()代替本函数。

如果传入字符的字符编码和最终的文档是一致的,则用函数处理的输入适合绝大多数 HTML 文档环境。 然而,如果输入的字符编码和最终包含字符的文档是不一样的, 想要保留字符(以数字或名称实体的形式),本函数以及htmlentities()(仅编码名称实体对应的子字符串)可能不够用。 这种情况可以使用mb_encode_numericentity()代替。

执行转换
字符替换后
&(& 符号)&
"(双引号)",除非设置了ENT_NOQUOTES
'(单引号)设置了ENT_QUOTES后,'(如果是ENT_HTML401),或者'(如果是ENT_XML1ENT_XHTMLENT_HTML5)。
<(小于)&lt;
>(大于)&gt;

参数

string

待转换的string

flags

位掩码,由以下某个或多个标记组成,设置转义处理细节、无效单元序列、文档类型。 默认是ENT_COMPAT | ENT_HTML401

有效的flags常量
常量名称描述
ENT_COMPAT会转换双引号,不转换单引号。
ENT_QUOTES既转换双引号也转换单引号。
ENT_NOQUOTES单/双引号都不转换
ENT_IGNORE静默丢弃无效的代码单元序列,而不是返回空字符串。 不建议使用此标记, 因为它» 可能有安全影响。
ENT_SUBSTITUTE替换无效的代码单元序列为 Unicode 代替符(Replacement Character), U+FFFD(UTF-8)或者 &#xFFFD;(其他),而不是返回空字符串。
ENT_DISALLOWED为文档的无效代码点替换为 Unicode 代替符(Replacement Character): U+FFFD(UTF-8),或 &#xFFFD;(其他),而不是把它们留在原处。 比如以下情况下就很有用:要保证 XML 文档嵌入额外内容时格式合法。
ENT_HTML401以 HTML 4.01 处理代码。
ENT_XML1以 XML 1 处理代码。
ENT_XHTML以 XHTML 处理代码。
ENT_HTML5以 HTML 5 处理代码。

encoding

An optional argument defining the encoding used when converting characters.

If omitted, the default value of theencodingvaries depending on the PHP version in use. In PHP 5.6 and later, thedefault_charsetconfiguration option is used as the default value. PHP 5.4 and 5.5 will useUTF-8as the default. Earlier versions of PHP useISO-8859-1.

Although this argument is technically optional, you are highly encouraged to specify the correct value for your code if you are using PHP 5.5 or earlier, or if yourdefault_charsetconfiguration option may be set incorrectly for the given input.

本函数使用效果上,如果string对以下字符编码是有效的,ISO-8859-1ISO-8859-15UTF-8cp866cp1251cp1252KOI8-R将具有相同的效果。 也就是说,在这些编码里, 受htmlspecialchars()影响的字符会占据相同的位置。

支持以下字符集:

支持的字符集列表
字符集别名描述
ISO-8859-1ISO8859-1西欧,Latin-1
ISO-8859-5ISO8859-5Little used cyrillic charset(Latin/Cyrillic).
ISO-8859-15ISO8859-15西欧,Latin-9。增加欧元符号,法语和芬兰语字母在 Latin-1(ISO-8859-1)中缺失。
UTF-8 ASCII 兼容的多字节 8 位 Unicode。
cp866ibm866, 866DOS 特有的西里尔编码。本字符集在 4.3.2 版本中得到支持。
cp1251Windows-1251, win-1251, 1251Windows 特有的西里尔编码。本字符集在 4.3.2 版本中得到支持。
cp1252Windows-1252, 1252Windows 特有的西欧编码。
KOI8-Rkoi8-ru, koi8r俄语。本字符集在 4.3.2 版本中得到支持。
BIG5950繁体中文,主要用于中国台湾省。
GB2312936简体中文,中国国家标准字符集。
BIG5-HKSCS 繁体中文,附带香港扩展的 Big5 字符集。
Shift_JISSJIS, 932日语
EUC-JPEUCJP日语
MacRoman Mac OS 使用的字符串。
'' An empty string activates detection from script encoding(Zend multibyte),default_charsetand current locale(seenl_langinfo()andsetlocale()), in this order. Not recommended.
其他字符集没有认可。将会使用默认编码并抛出异常。

double_encode

关闭double_encode时,PHP 不会转换现有的 HTML 实体, 默认是全部转换。

淘宝 adsense 商品推荐

正版 Google AdSense实战宝典:用谷歌广告联盟出海赚美元 第2版 seo搜索引擎优化 广告营销 网站运营书籍 AdSense从入门到精通

价格:39.5元

返回值

转换后的string

如果指定的编码encoding里,string包含了无效的代码单元序列, 没有设置ENT_IGNORE或者ENT_SUBSTITUTE标记的情况下,会返回空字符串。

更新日志

版本说明
5.6.0The default value for theencodingparameter was changed to be the value of thedefault_charsetconfiguration option.
5.4.0encoding参数的默认值改成 UTF-8。
5.4.0增加常量ENT_SUBSTITUTEENT_DISALLOWEDENT_HTML401ENT_XML1ENT_XHTMLENT_HTML5
5.3.0增加常量ENT_IGNORE
5.2.3增加参数double_encode

范例

Example #1htmlspecialchars()例子

<?php
$new = htmlspecialchars("<a href='test'>Test</a>", ENT_QUOTES);
echo $new; // &lt;a href=&#039;test&#039;&gt;Test&lt;/a&gt;
?>

淘宝 云主机 商品推荐

远程电脑出租E3E5物理双路服务器租用云主机渲染模拟器虚拟机多开

价格:19元

注释

注意,本函数不会转换以上列表以外的实体。 完整转换请参见htmlentities()
如果flags的设置模糊易混淆,将遵循以下规则:
  • 当 ent_compat、ent_quotes、ent_noquotes 都没设置, 默认就是 ent_compat。
  • 如果设置不止一个 ent_compat、 ent_quotes、 ent_noquotes ,优先级最高的是 ent_quotes, 其次是 ent_compat。
  • 当 ent_html401、 ent_html5、 ent_xhtml、 ent_xml1 都没设置,默认是 ent_html401。
  • 如果设置不止一个 ent_html401、 ent_html5、 ent_xhtml、 ent_xml1, 优先级最高的是 ent_html5 其次是 ent_xhtml 和 ent_html401。
  • 如果设置不止一个 ent_disallowed、 ent_ignore、 ent_substitute,优先级最高的是 ent_ignore, 其次是 ent_substitute。

参见

get_html_translation_table()- 返回使用 htmlspecialchars 和 htmlentities 后的转换表

htmlspecialchars_decode()- 将特殊的 HTML 实体转换回普通字符

strip_tags()- 从字符串中去除 HTML 和 PHP 标记

htmlentities()- 将字符转换为 HTML 转义字符

nl2br()- 在字符串所有新行之前插入 HTML 换行标记

淘宝 SEO书 商品推荐

网店推广 中级 北京鸿科经纬科技有限公司 高等教育出版社 职业技能证书1+X证书配套理论教材SEO优化SEM推广信息流推广图书籍

价格:46.5元