خانه / کامپیوتر و IT / دانستنی ها / درباره Unicode و ASCII

درباره Unicode و ASCII

کامپیوترها مثل انسان ها نیستند که حروف و علامات را به خاطر بسپارند و تمامی کارهایی که آنها انجام می دهند از طریق صفر و یک و اعداد است ، برای نمایش دادن کاراکترها و اشکال مختلف در برنامه ها و هر محیط دیگر کامپیوتری ، سیستم های کامپیوتری برای نمایش سمبل ها و علامات به هر کدام از آنها یک عدد اختصاص می دهند و با اینکار یک استاندارد برای خودشان ایجاد می کنند که علامات و سمبل ها را بتوانند نمایش دهند. Unicode و ASCII هر دو از استانداردهایی هستند که برای Encoding متن ها استفاده می شوند. استفاده از این استانداردها در سراسر دنیا یک امر بسیار مهم است ، در یک استاندارد یا Code به این شکل هر سمبل یا Symbol ( کاراکتر ( بدون توجه به نوع زبان برنامه نویسی که از آن استفاده می شود برای خودش یک عدد منحصر به فرد دریافت می کند. وقتی صحبت از استاندارد می شود یعنی چه برنامه نویس های شخصی و چه شرکت ها و سازمان های بزرگی که در زمینه برنامه نویسی فعالیت می کنند باید از این استانداردها تبعیت کنند و در اینجاست که دو استاندارد مهم ASCII و Unicode بسیار پر کاربرد هستند و بیشترین استفاده را در استانداردهای Encoding به خودشان اختصاص می دهند.

در واقع این نوع استانداردها یک نوع پروتکل یا یک زبان مشترک هستند که می توانند باعث شوند که زبان های مختلف با هم ارتباط برقرار کنند. برقراری ارتباط بین زبان های مختلف در کشورهای مختلف با همدیگر همیشه یکی از مشکلات در عرصه وب و برنامه نویسی بوده است و راهکاری برای حل این مشکل استفاده از یک الگوی برنامه نویسی و Encoding می باشد. هر کشوری برای خودش استاندارد Encoding خاص خود را طراحی کرده بود و این باعث می شد که شما زمانیکه به یک وب سایت چینی وارد می شدید با خواندن متون موجود در این صفحه به مشکل بخورید ، برای حل این مشکل نیاز به طراحی یک استاندارد Encoding برای اجرا شدن در همه پلتفرم های برنامه نویسی در دنیا بود که به آن Universal Encoding System می گفتند و همین موضوع باعث به وجود آمدن استانداردهای ASCII و Unicode شد.

Unicode چیست

Unicode یا یونیکد چیست ؟


طراحی و توسعه استاندارد Encoding یونیکد توسط یک سازمان عام المنفعه به نام کنسرسیوم Unicode انجام شد. استاندارد Unicode با اکثر زبان های برنامه نویسی از قیبل Java ، XML ، Microsoft .Net و … سازگاری کامل دارد. اشکال سمبلیک و نمادهای تجاری با استفاده از مکانیزم هایی که در قالب کاراکترها در Unicode ایجاد شده بودند براحتی در دسترس کاربران قرار گرفته اند. با ابداع شدن استاندارد Unicode یک تحول و نوآوری گسترده در طراحی های گرافیکی ، متن ها ، قالب های تصویری و به طول کلی در دنیای وب و برنامه نویسی ایجاد شد. همانطور که عنوان کردیم در Encoding یا کدگذاری همه علامت ها و سمبل ها در قالب یک عدد منحصر به فرد نمایان می شوند و این باعث می شود که اعداد و سمبل ها براحتی در شبکه ها مختلف و محیط وب منتقل شوند و نیازی به ایجاد کردن عکس برای آنها نباشد. جدیدترین نسخه هایی که از Unicode ارائه شده اند بیش از 109000 کاراکتر ، چارت های گرافیکی ، متدولوژی های کدگذاری ، استانداردهای کدگذاری ، نمایش دو طرفه و بسیاری دیگر از امکانات را درون خود دارند. UTF-8 یکی از انواع استانداردهای Unicode است که امروزه بیشترین استفاده را دارد. امروزه کنسرسیوم Unicode از شرکت هایی که در عرصه تولید نرم افزار صاحب سبک هستند اعم از مایکروسافت ، اپل ، Sun Microsystems ، یاهو ، IBM ، گوگل و اوراکل تشکیل شده است. اولین کتاب Unicode در سال 1991 توسط این کنسرسیوم به چاپ رسید و از طرفی آخرین نسخه آن که Unicode 6.0 است در سال 2010 منتشر شد.

تفاوت Unicode و ASCII

ASCII یا اسکی چیست ؟


ASCII مخفف کلمه های American Standard Code for Information Interchange می باشد که ترجمه فارسی آن کد استاندارد آمریکایی برای تبادلات اطلاعاتی است. کدگذاری یا Encoding ای که ASCII بر پایه و اساس آن ایجاد شده است بر اساس ترتیب حروف الفبای انگلیسی طراحی شده است. تمامی ماشین های کدگذاری داده های امروزی از استاندارد ASCII همانند استانداردهای دیگر موجود در این زمینه پشتیبانی می کنند. ASCII برای اولین بار در یک Tele-Printer هفت بیتی مورد استفاده قرار گرفت. با معرفی شدن ساختار دودویی و استفاده از سیستم دودویی در ساختار پردازشی تحولی شگرف در عرصه محاسبات به وجود آمد. امروزه تقریبا همه سیستم های کامپیوتری اعم از شخصی و سازمانی از زبان باینری به عنوان هسته اصلی کارها برای انجام عملیات های کدگذاری یا Encoding و کدبرداری یا Decoding استفاده می کنند. حتی بیشتر زبان های برنامه نویسی امروزی نیز بر پایه و اساس منطق دودویی کار می کنند. همانطور که ساختار باینری باعث بهبود کار کردن PC های ما و برقراری ارتباط ساده تر برای افراد با کامپیوتر می شود ، ASCII نیز برای ساده کردن برقراری ارتباطات مورد استفاده قرار می گیرد. بصورت کلی می توانیم تفاوت های ASCII و Unicode را به شکل زیر عنوان کنیم :

  • ASCII اجازه استفاده از 128 کاراکتر را می دهد اما Unicode تعداد کاراکتر بسیار زیادی را پشتیبانی می کند
  • ASCII و UTF-8 بیشترین استفاده را در پروتکل WWW دارند اما ASCII در حال جایگزین شدن با UTF-8 است
  • ترتیب کدگذاری ASCII با ترتیب حروف الفبایی است
  • ترتیب کدگذاری Unicode بر اساس اعداد منحصر به فرد است
  • ASCII بیشتر برای Encoding کاراکترهای زبان انگلیسی مورد استفاده قرار می گیرد
  • Unicode برای Encoding تقریبا همه کاراکترهای زبان های مختلف مورد استفاده قرار می گیرد
  • Unicode برای نمایش از ساختار 8 ، 16 و 32 بیتی استفاده می کند
  • ASCII برای نمایش از ساختار و فرمول 7 بیتی استفاده می کند
  • در نهایت بیشترین تفاوت ASCII و Unicode در نمایش صفحات وب است

نویسنده : محمد نصیری
منبع : انجمن تخصصی فناوری اطلاعات ایران

درباره ی modir

همچنین ببینید

شماره های پیامکی

همه شماره پیامک های مهم کشور

  شماره پیامکهای ارگانهای دولتی شماره پیامک های مهم کشور : ۶۰۰۰ شماره پیامک نیروی انتظامی ...

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *