دیده‌بان گاه‌نگاری‌های بهرنگ تاج‌دین
خوراک وبلاگ
چهارشنبه ۱۰ آبان‌ماه ۱۳۸۵

«ي» يا «ی»؟ مسأله اين است

۱- يکي از مشکلات اساسي زبان فارسي بر روي اينترنت، املاي متفاوت حروف است. به اين معني که براي هر يک از دو حرف «کاف» و «ي» دو نگارش متفاوت، يا به بيان بهتر دو کاراکتر متفاوت داريم.
مثلاْ براي حرف کاف، دو کاراکتر با کد يونيکد ۱۷۰۵ و ۱۶۰۳ وجود دارد که به ترتيب «ک» فارسي و «ك» عربي را مي‌سازند.
در مورد آخرين حرف الفبا نيز دو کاراکتر با کد يونيکد ۱۷۴۰ و ۱۶۱۰ وجود دارد که به ترتيب «ی» فارسي و «ي» عربي را مي‌سازند که يکي دو نقطه در زير دارد و ديگري نه.

۲- بگذاريد کمي به عقب باز گرديم. زماني که اولين نسخه‌هاي فارسي ويندوز ۹۸ صفحه کليدي نزديک به عربي داشتند و با زدن دکمه D حرف «ي» نقطه‌دار را وارد مي‌کردند و «;» هم «ك» عربي را
بعدتر که ويندوز ۲۰۰۰ و XP، امکان فارسي‌نويسي را اضافه کردند، «ک» فارسي را جايگزين «ك» عربي کردند و کليد D هم «ی» فارسي را وارد مي‌کرد. اما بر خلاف «ك» عربي، «ي» از اين صفحه کليد حذف نشده بود و با گرفتن کليد ترکيبي «Shift+X» مي‌شد نوشت: «ي»

۳- خب، مشکل چيست؟
سه مشکل داريم. يکي ويندوزهاي قديمي (يا بهتر است بگوييم نسخه‌هاي قديمي فونت‌ها) هستند که با دو کاراکتر «ک» و «ی» فارسي مشکل دارند و در صورت استفاده از اين دو کاراکتر، کلمات در هم مي‌ريزند. مثلاْ کلمه «كثير» اگر با «ک» و «ی» فارسي نوشته شود، چيزي شبيه به «ک‌ـثـ‌ی‌ـر» ديده مي‌شود. البته با گسترش روزافزون ويندوزهاي جديد، اين مشکل چندان مصداق ندارد و امروزه، بيش از ۹۵ درصد کامپيوترهاي فارسي‌زبانان از ويندوزهاي ۲۰۰۰ يا جديدتر از آن استفاده مي‌کنند که مشکلي نمايش اين حروف را ندارند.

۴- اما دومين و بهتر است بگوييم مهم‌ترين مشکل، مسأله جستجو است. مشکل چند کاراکتر براي يک حرف، فقط مشکل فارسي نيست. کلاْ زبان‌هاي اروپايي داراي حروف بزرگ و کوچک هستند که هر کدام کاراکتر متفاوتي دارند. اما گوگل بين «george» و «George» و «gEoRgE» تفاوتي قائل نيست. همين طور بين «ö» آلماني با «o» انگليسي يا «é» فرانسوي و «e» انگليسي (کافي است جستجو کرده، تعداد يافته‌ها را مقايسه کنيد) اين رويه براي «ک» فارسي و «ك» عربي هم مصداق دارد.
اما متأسفانه گوگل بين دو کاراکتر «ي» و «ی» تفاوت مي‌گذارد. از آن طرف عده‌اي همه جا، از «ي» عربي استفاده مي‌کنند. عده‌اي ديگر، همه جا «ی» فارسي را به کار مي‌برند و برخي هم براي اول يا وسط کلمات از «ي» عربي و براي آخر کلمات از «ی» فارسي استفاده مي‌کنند. يعني سه نگارش مختلف براي يک کلمه و از نظر گوگل «سه کلمه متفاوت»

۵- اما مشکل سومي هم در بين هست. آن مشکل اين است که مثلاْ هنگامي که در يکي از نرم‌افزارهاي Microsoft Office چيزي مي‌نويسيد، هر يک از دو حرف «ک» و «ی» فارسي، يک کلمه فرض مي‌شوند. از سوي ديگر، بسياري از فونت‌هاي فارسي مثل ميترا، تيتر، نازنين و لوتوس، با «ک» و به ويژه «ی» فارسي مشکل دارند.

۶- البته مشکل عجيب ديگري هم جديداْ پيدا شده است. آن هم اين که سابق بر اين، گوگل، نيم‌فاصله را فاصله فرض مي‌کرد و براي نمونه کليدواژه «ديده‌بان» هم‌ارز «ديده بان» بود. اما جديداْ اين رويه تغيير پيدا کرده و مثلاْ اگر يک بار «کتاب‌ها» و بار ديگر «کتابها» را جستجو کنيد، خواهيد ديد که نتايج کاملاْ يکساني به شما عرضه مي‌شود. شايد براي علامت جمع، اين رويه مناسبي باشد، اما قطعاْ براي افعالي مثل «مي‌خواهم» يا واژگاني مثل ترانه‌ها، ديده‌بان، پايين‌تر، اصلاح‌طلب و جامعه‌شناسي به هيچ وجه مناسب نيست. جالب اين که نرم‌افزار گوگل‌دسکتاپ من، «کتاب‌ها» را معادل «کتاب ها» مي‌داند و خود جستجوگر وب گوگل معادل «کتابها»

۷- با اين وضعيت، نه من وبلاگ‌نويس و صاحب سايت مي‌دانم که چطور بنويسم که همه درست ببينند؛ نه آن کاربر عادي مي‌داند که با چه املا يا بهتر بگوييم، با کدام «ي» بنويسد که آن چه را مي‌خواهد، بيابد.

۸- اي کاش در کنار رأي دادن به رضازاده و کريمي براي ارضاي عرق ملي، يا امضا کردن هزار و يک جور تومار اعتراض‌آميز (Petition)، مي‌نشستيم و به گوگل ايميل مي‌زديم و مي‌گفتيم که «حضرت گوگل! «ي» همان «ی» است. چرا تبعيض قائل مي‌شوي!؟»

بالاترین  دلیشس  توییتر  فرندفید  فیس‌بوک


یادداشت‌های شما:

نکته جالبی است. اما ممنون میشم اگه قالب وبلاگتو یک کم دست بزنی. نصف مونیتور من بلا استفاده مونده.

[ آرش ] | [چهارشنبه، ۱۰ آبان‌ماه ۱۳۸۵، ۳:۴۷ صبح ]


ba to va salman movafegham

[ A Man ] | [چهارشنبه، ۱۰ آبان‌ماه ۱۳۸۵، ۷:۲۰ بعدازظهر ]


بله.... ي همان ی است.... اما بهتر نیست که ما همیشه ی به کار ببریم؟ .....

تو که همیشه این کار رو رعایت میکردی ....چی شد این بار همش ي نوشتی ؟

[ behrouz ] | [شنبه، ۲۰ آبان‌ماه ۱۳۸۵، ۵:۴۹ بعدازظهر ]


با سلام ممنون از وبلاگ خوب شما
حالا برای صفحات جستجویی که من نوشتم باید چی کار کنم که همین مشکل ی و ي را داره لطفا کمک کنید

[ behto ] | [یکشنبه، ۱۸ فروردین‌ماه ۱۳۸۷، ۱:۴۹ بعدازظهر ]