codecamp

Unicode 格式控制字符

Unicode 格式控制字符(即,Unicode 字符数据库中“Cf”分类里的字符,如“左至右符号 (left-to-right mark)”或“右至左符号 (left-to-right mark)”)是用来控制被更高层级协议(如标记语言)忽略的文本范围的格式的控制代码。


允许在源文本中出现控制字符是有用的,以方便编辑和显示。所有格式控制字符可写入到注释,字符串字面量,正则表达式字面量中。


在某些语言中和控制字符用于创建必要的的分隔符分割词或短语。在 ECMAScript 源文本里,和还可以用在一个标识符后的第一个字符。


控制字符主要出现的文本的开头,标记它是 Unicode,并允许检测文本的编码和字节顺序。用于这一目的字符,有时也可能出现在文本开始的后面,例如,一个合并的文件。字符被视为空白字符(见 [7.2])。


表 1 总结了一些在注释,字符串字面量,正则表达式字面量之外被特殊对待的格式控制字符。


表-——控制字符的使用
字符编码值名称正式名称用途
\u200C零宽非连接符<ZWNJ>IdentifierPart
\u200D零宽连接符<ZWJ>IdentifierPart
\uFEFF位序掩码<BOM>Whitespace


源代码文本
空白字符
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }