HTMLエンティティエンコード
テキストをHTMLエンティティにエンコード、またはHTMLエンティティをテキストにデコード。
HTMLエンティティとは?
HTMLエンティティは、HTMLで予約された文字(<, >, &, " など)や、標準キーボードにない文字(©, ™, €, ¥ など)を表示するために使用される特殊なコードです。
一般的なHTMLエンティティ
- & - アンパサンド (&)
- < - 小なり記号 (<)
- > - 大なり記号 (>)
- " - 二重引用符 (")
- ' - 一重引用符/アポストロフィ (')
- - 改行なしスペース
HTMLエンティティを使用するタイミング
- XSS防止:ユーザー生成コンテンツを表示する際に、クロスサイトスクリプティング攻撃を防ぐためにユーザー入力をエンコードします
- 特殊文字の表示:<, >, & などの文字を、HTMLタグとして解釈されずにHTML内で表示します
- 特殊文字:著作権 (©)、商標 (™)、その他の特殊記号を正しく表示します
- Unicode文字:数値エンティティを使用してUnicode文字を表現します(例:€の場合は €)
数値HTMLエンティティ
HTMLエンティティは2つの方法で表現できます:名前付きエンティティ(&など)と数値エンティティ(& または &など)。
- 10進数エンティティ:&# の後に10進数を記述します(例:©の場合は ©)
- 16進数エンティティ:&#x の後に16進数を記述します(例:©の場合は ©)