چهارشنبه ۱۰ آبانماه ۱۳۸۵
«ي» يا «ی»؟ مسأله اين است
۱- يکي از مشکلات اساسي زبان فارسي بر روي اينترنت، املاي متفاوت حروف است. به اين معني که براي هر يک از دو حرف «کاف» و «ي» دو نگارش متفاوت، يا به بيان بهتر دو کاراکتر متفاوت داريم.
مثلاْ براي حرف کاف، دو کاراکتر با کد يونيکد ۱۷۰۵ و ۱۶۰۳ وجود دارد که به ترتيب «ک» فارسي و «ك» عربي را ميسازند.
در مورد آخرين حرف الفبا نيز دو کاراکتر با کد يونيکد ۱۷۴۰ و ۱۶۱۰ وجود دارد که به ترتيب «ی» فارسي و «ي» عربي را ميسازند که يکي دو نقطه در زير دارد و ديگري نه.
۲- بگذاريد کمي به عقب باز گرديم. زماني که اولين نسخههاي فارسي ويندوز ۹۸ صفحه کليدي نزديک به عربي داشتند و با زدن دکمه D حرف «ي» نقطهدار را وارد ميکردند و «;» هم «ك» عربي را
بعدتر که ويندوز ۲۰۰۰ و XP، امکان فارسينويسي را اضافه کردند، «ک» فارسي را جايگزين «ك» عربي کردند و کليد D هم «ی» فارسي را وارد ميکرد. اما بر خلاف «ك» عربي، «ي» از اين صفحه کليد حذف نشده بود و با گرفتن کليد ترکيبي «Shift+X» ميشد نوشت: «ي»
۳- خب، مشکل چيست؟
سه مشکل داريم. يکي ويندوزهاي قديمي (يا بهتر است بگوييم نسخههاي قديمي فونتها) هستند که با دو کاراکتر «ک» و «ی» فارسي مشکل دارند و در صورت استفاده از اين دو کاراکتر، کلمات در هم ميريزند. مثلاْ کلمه «كثير» اگر با «ک» و «ی» فارسي نوشته شود، چيزي شبيه به «کـثـیـر» ديده ميشود. البته با گسترش روزافزون ويندوزهاي جديد، اين مشکل چندان مصداق ندارد و امروزه، بيش از ۹۵ درصد کامپيوترهاي فارسيزبانان از ويندوزهاي ۲۰۰۰ يا جديدتر از آن استفاده ميکنند که مشکلي نمايش اين حروف را ندارند.
۴- اما دومين و بهتر است بگوييم مهمترين مشکل، مسأله جستجو است. مشکل چند کاراکتر براي يک حرف، فقط مشکل فارسي نيست. کلاْ زبانهاي اروپايي داراي حروف بزرگ و کوچک هستند که هر کدام کاراکتر متفاوتي دارند. اما گوگل بين «george» و «George» و «gEoRgE» تفاوتي قائل نيست. همين طور بين «ö» آلماني با «o» انگليسي يا «é» فرانسوي و «e» انگليسي (کافي است جستجو کرده، تعداد يافتهها را مقايسه کنيد) اين رويه براي «ک» فارسي و «ك» عربي هم مصداق دارد.
اما متأسفانه گوگل بين دو کاراکتر «ي» و «ی» تفاوت ميگذارد. از آن طرف عدهاي همه جا، از «ي» عربي استفاده ميکنند. عدهاي ديگر، همه جا «ی» فارسي را به کار ميبرند و برخي هم براي اول يا وسط کلمات از «ي» عربي و براي آخر کلمات از «ی» فارسي استفاده ميکنند. يعني سه نگارش مختلف براي يک کلمه و از نظر گوگل «سه کلمه متفاوت»
۵- اما مشکل سومي هم در بين هست. آن مشکل اين است که مثلاْ هنگامي که در يکي از نرمافزارهاي Microsoft Office چيزي مينويسيد، هر يک از دو حرف «ک» و «ی» فارسي، يک کلمه فرض ميشوند. از سوي ديگر، بسياري از فونتهاي فارسي مثل ميترا، تيتر، نازنين و لوتوس، با «ک» و به ويژه «ی» فارسي مشکل دارند.
۶- البته مشکل عجيب ديگري هم جديداْ پيدا شده است. آن هم اين که سابق بر اين، گوگل، نيمفاصله را فاصله فرض ميکرد و براي نمونه کليدواژه «ديدهبان» همارز «ديده بان» بود. اما جديداْ اين رويه تغيير پيدا کرده و مثلاْ اگر يک بار «کتابها» و بار ديگر «کتابها» را جستجو کنيد، خواهيد ديد که نتايج کاملاْ يکساني به شما عرضه ميشود. شايد براي علامت جمع، اين رويه مناسبي باشد، اما قطعاْ براي افعالي مثل «ميخواهم» يا واژگاني مثل ترانهها، ديدهبان، پايينتر، اصلاحطلب و جامعهشناسي به هيچ وجه مناسب نيست. جالب اين که نرمافزار گوگلدسکتاپ من، «کتابها» را معادل «کتاب ها» ميداند و خود جستجوگر وب گوگل معادل «کتابها»
۷- با اين وضعيت، نه من وبلاگنويس و صاحب سايت ميدانم که چطور بنويسم که همه درست ببينند؛ نه آن کاربر عادي ميداند که با چه املا يا بهتر بگوييم، با کدام «ي» بنويسد که آن چه را ميخواهد، بيابد.
۸- اي کاش در کنار رأي دادن به رضازاده و کريمي براي ارضاي عرق ملي، يا امضا کردن هزار و يک جور تومار اعتراضآميز (Petition)، مينشستيم و به گوگل ايميل ميزديم و ميگفتيم که «حضرت گوگل! «ي» همان «ی» است. چرا تبعيض قائل ميشوي!؟»
یادداشتهای شما:
نکته جالبی است. اما ممنون میشم اگه قالب وبلاگتو یک کم دست بزنی. نصف مونیتور من بلا استفاده مونده.
[ آرش ] | [چهارشنبه، ۱۰ آبانماه ۱۳۸۵، ۳:۴۷ صبح ]ba to va salman movafegham
[ A Man ] | [چهارشنبه، ۱۰ آبانماه ۱۳۸۵، ۷:۲۰ بعدازظهر ]بله.... ي همان ی است.... اما بهتر نیست که ما همیشه ی به کار ببریم؟ .....
تو که همیشه این کار رو رعایت میکردی ....چی شد این بار همش ي نوشتی ؟
[ behrouz ] | [شنبه، ۲۰ آبانماه ۱۳۸۵، ۵:۴۹ بعدازظهر ]با سلام ممنون از وبلاگ خوب شما
حالا برای صفحات جستجویی که من نوشتم باید چی کار کنم که همین مشکل ی و ي را داره لطفا کمک کنید