021-28423015

مجموعه کاراکتر های در HTML

encoding یا مجموعه کاراکتر ها در HTML

برای نمایش صحیح یک صفحه HTML ، مرورگر باید بداند که چه مجموعه ای از کاراکترها را باید استفاده کند.


character encoding (مجموعه کاراکترها )  چیست؟

ASCII اولین استاندارد مجموعه کاراکترها بود. ASCII توانست 127 کاراکتر الفبایی که می شد بر روی اینترنت استفاده کرد را تعریف کند. مانند اعداد ، حروف انگلیسی و برخی سمبل ها و علامت های خاص مانند @ #  $ &
ANSI یا  (Windows-1252) مجموعه کاراکتر اورجینال ویندوز بود (با توانایی پشتیبانی از 256 کد کاراکتر مختلف)
ISO-8859-1 مجموع کاراکتر پیش فرض HTML4 بود. این مجموعه نیز توانایی پشتیبانی از 256 کد کاراکتر مختلف را داشت. چون ANSI و ISO-8859-1 محدود بودند ، مجموعه کاراکتر پیش فرض در HTML5 به UTF-8 تغییر یافت.
UTF-8 (Unicode) تقریبا تمامی کاراکتر ها و سمبل های موجود در جهان را پوشش می دهد. همچنین همه پردازشگر های HTML4 از UTF-8 پیشتبانی می کنند.

صفت charset در HTML

این صفت برای تفهیم مرورگر از بابت مجموعه کاراکتر های استفاده شده در صفحه می باشد تا صفحه به درستی نمایش داده شود. این گزینه را در داخل تگ <meta> مشخص می کنیم.

در HTML4 :
 <meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

در HTML5 :
 <meta charset="UTF-8">


اگر مرورگر ISO-8859-1 را تشخیص دهد بصورت پیش فرض به ANSI تبدیل می شود زیرا با این مجموعه یکسان است. البته ANSI 32 کاراکتر بیشتر را پشتیبانی می کند.


تفاوت های بین مجموعه کاراکتر ها

جدول زیر تفاوت های میان مجموعه های توضیح داده شده در بالا را مشخص می کند :

شماره ASCII ANSI 8859 UTF-8
32



33 ! ! ! !
34 " " " "
35 # # # #
36 $ $ $ $
37 % % % %
38 & & & &
39 ' ' ' '
40 ( ( ( (
41 ) ) ) )
42 * * * *
43 + + + +
44 , , , ,
45 - - - -
46 . . . .
47 / / / /
48 0 0 0 0
49 1 1 1 1
50 2 2 2 2
51 3 3 3 3
52 4 4 4 4
53 5 5 5 5
54 6 6 6 6
55 7 7 7 7
56 8 8 8 8
57 9 9 9 9
58 : : : :
59 ; ; ; ;
60 < < < <
61 = = = =
62 > > > >
63 ? ? ? ?
64 @ @ @ @
65 A A A A
66 B B B B
67 C C C C
68 D D D D
69 E E E E
70 F F F F
71 G G G G
72 H H H H
73 I I I I
74 J J J J
75 K K K K
76 L L L L
77 M M M M
78 N N N N
79 O O O O
80 P P P P
81 Q Q Q Q
82 R R R R
83 S S S S
84 T T T T
85 U U U U
86 V V V V
87 W W W W
88 X X X X
89 Y Y Y Y
90 Z Z Z Z
91 [ [ [ [
92 \ \ \ \
93 ] ] ] ]
94 ^ ^ ^ ^
95 _ _ _ _
96 ` ` ` `
97 a a a a
98 b b b b
99 c c c c
100 d d d d
101 e e e e
102 f f f f
103 g g g g
104 h h h h
105 i i i i
106 j j j j
107 k k k k
108 l l l l
109 m m m m
110 n n n n
111 o o o o
112 p p p p
113 q q q q
114 r r r r
115 s s s s
116 t t t t
117 u u u u
118 v v v v
119 w w w w
120 x x x x
121 y y y y
122 z z z z
123 { { { {
124 | | | |
125 } } } }
126 ~ ~ ~ ~
127 DEL      
128      
129     
130      
131   ƒ    
132      
133      
134      
135      
136   ˆ    
137      
138   Š    
139      
140   Œ    
141     
142   Ž    
143     
144     
145      
146      
147      
148      
149      
150      
151      
152   ˜    
153      
154   š    
155      
156   œ    
157     
158   ž    
159   Ÿ    
160        
161   ¡ ¡ ¡
162   ¢ ¢ ¢
163   £ £ £
164   ¤ ¤ ¤
165   ¥ ¥ ¥
166   ¦ ¦ ¦
167   § § §
168   ¨ ¨ ¨
169   © © ©
170   ª ª ª
171   « « «
172   ¬ ¬ ¬
173   ­ ­ ­
174   ® ® ®
175   ¯ ¯ ¯
176   ° ° °
177   ± ± ±
178   ² ² ²
179   ³ ³ ³
180   ´ ´ ´
181   µ µ µ
182  
183   · · ·
184   ¸ ¸ ¸
185   ¹ ¹ ¹
186   º º º
187   » » »
188   ¼ ¼ ¼
189   ½ ½ ½
190   ¾ ¾ ¾
191   ¿ ¿ ¿
192   À À À
193   Á Á Á
194   Â Â Â
195   Ã Ã Ã
196   Ä Ä Ä
197   Å Å Å
198   Æ Æ Æ
199   Ç Ç Ç
200   È È È
201   É É É
202   Ê Ê Ê
203   Ë Ë Ë
204   Ì Ì Ì
205   Í Í Í
206   Î Î Î
207   Ï Ï Ï
208   Ð Ð Ð
209   Ñ Ñ Ñ
210   Ò Ò Ò
211   Ó Ó Ó
212   Ô Ô Ô
213   Õ Õ Õ
214   Ö Ö Ö
215   × × ×
216   Ø Ø Ø
217   Ù Ù Ù
218   Ú Ú Ú
219   Û Û Û
220   Ü Ü Ü
221   Ý Ý Ý
222   Þ Þ Þ
223   ß ß ß
224   à à à
225   á á á
226   â â â
227   ã ã ã
228   ä ä ä
229   å å å
230   æ æ æ
231   ç ç ç
232   è è è
233   é é é
234   ê ê ê
235   ë ë ë
236   ì ì ì
237   í í í
238   î î î
239   ï ï ï
240   ð ð ð
241   ñ ñ ñ
242   ò ò ò
243   ó ó ó
244   ô ô ô
245   õ õ õ
246   ö ö ö
247   ÷ ÷ ÷
248   ø ø ø
249   ù ù ù
250   ú ú ú
251   û û û
252   ü ü ü
253   ý ý ý
254   þ þ þ
255   ÿ ÿ ÿ

 

مجموعه ASCII
از مقادیر 0 تا 31 (و 127) برای کنترل کاراکتر ها و 32 تا 126 برای تعیین حروف ، ارقام و سمبل ها استفاده می کند. این مجموعه از مقادیر 128 تا 255 استفاده نمی کند.

مجموعه ANSI
این مجموعه از 0 تا 127 با ASCII برابر است. این مجموعه دارای مجموعه ای اختصاصی از کاراکتر هابرا مقادیر 128 تا 159 می باشد. و در مقادیر 160 تا 255 با UTF-8 برابر است.

مجموعه ISO-8859-1
این مجموعه از مقادیر 0 تا 127 با ASCII برابر است. از مقادیر 128 تا 159 استفاده نمی کند و از مقادیر 160 تا 255 با UTF-8 برابر است.

مجموعه UTF-8
از مقادیر 0 تا 127 با ASCII برابر است. از مقادیر 128 تا 159 استفاده نمی کند و از مقادیر 160 تا 255 با هر دو گروه ANSI و 8859-1 برابر است. مجموعه کاراکترهای UTF-8 از مقدار 256 تا بیش از 10.000 کاراکتر ادامه دارد.


نظر شما

لطفا نام و نام خانوادگی خود را وارد کنید
لطفا ایمیل خود را وارد کنید لطفا ایمیل صحیح وارد کنید.
لطفا متن نظر خود را وارد کنید
>

مقالات و دروس

عضویت در خبرنامه شرکت نرم افزاری وب مهراز

برای اطلاع از بسته ها ، تخفیف های استثنایی و تازه های ما به خبرنامه وب مهراز بپیوندید.

لطفا شماره همراه صحیح وارد کنید.
لطفا ایمیل صحیح وارد کنید.

مقالات مرتبط