برگردان نمیکنه. شما باید فارسی بنویسید خودتون. فقط پانویس میکنه.
نمایش نسخه قابل چاپ
یعنی خودم باید واژه های پارسیک رو بلد باشم و بکار ببرم؟ فک کردم خودش کلمه هایی رو که مینویسم به پارسی برگردان میکنه. فکر میکردم مثلا اگه بنویسم ساعت، بصورت خودکار مینویسه تسو.. :e11b:
خب حالا من بلد نیستم راه بندازمش. اگه راه انداختنش راحت هست میخوام امتحانش کنم.
آری شدنش که میشود, به اُمید اسپاگتی این را هم — اگر سرمایهداری به ما پروانهیِ نفس کشیدن از کار داد — درست میکنم (:
تنها دشواری مهندی که باید برداشته شود واژهگزینی با نگرش به بافتار است, که دوست دارم با خوارزمیگهایِ درگاشتِ بیشترینه با آن دست و پنجه نرم کنم, برای نمونه همین "ساعت" در دو بافتار اینجور درمیاید:
ساعت آبیِ زیبایی است = گاهشمار آبی زیباییست / پَنگان زیباییست.
ساعت چنده؟ = تسو چنده؟
که خود این نیاز به واگشایش پرسمان بخشگفتار یابی (POSTagging) دارد, نرمافزار باید بگیرد "ساعت آبی" یک نامِ آموده (compound noun) است و "آبی" زاب و ...
یا اینکه یک راهِ آسانتر بتوان یافت.
پارسیگر
من پیشتر روی یک برنامه بسیار کوچک و ساده کار کردم. مشکلی رو در این برنامه ی مهربد دیدم که منو یاد اون انداخت. اون برنامه ی من درباره تبدیل خط سریلیک تاجیکی به فارسی و برعکس بود. مشکلی که در تبدیل خط فارسی به تاجیکی وجود داشت و در تبدیل تاجیکی به فارسی نداشت این بود که مثلا در خط فارسی واکه های کوتاه(-َ -ِ -ُ) نوشته نمی شود.(البته مشکلات زیاد دیگه ای هم بود، حالا من این یکی رو نام بردم.) مثلا میخواستیم "کی" را از خط فارسی به خط تاجیکی برگردانیم. ولی حداقل با روشهای معمولی، در عمل نمیتوان تشخیص داد که منظور Key به معنای چه وقت است یا Ki به معنای چه کسی. حالا این برنامه ی مهربد هم همین مشکل رو داره. مثلا در "ایران پرس نیوز" واژه Press را چیز دیگری(Pors) برداشت کرده.
حالا میخواستم بگم اگر اون چیزی که مزدک گرامی گفت عملی شود این مشکل شاید برجسته تر بشه... چون در حالت کنونی اگر فلان واژه را اشتباه برداشت کند این اشتباه تنها روی پانویس تاثیر میگذاره ولی در حالتی که پیشنهاد شد این خطاها به متن پست کشیده میشه... امیدوارم هر زودتر از این خط مزخرف خلاص بشیم.
دبیرهیِ پارسوتازیک (همینی که داریم روی آن مینویسم) یک دبیرهیِ به درد نخور و ناکارآمد است, بویژه برای زبان ما, ولی برای چیزیکه گفتید, من همهیِ این برنامهیِ برچسب زن را در چند ساعت برای کارِ خودم سرهم کرده بودم ( نرمافزار پارسیکنمایِ پینویس - PN² ) و چون شمار این همپوشانیها کم بودند به آن بهایی نداده بودم, ولی نون که کم کم دارد به شمار کاربران برنامه افزوده میشود باید کمی بهکرد و بازویراست, کار چندانی نمیبرد, باید نگریست که:
اول = ul
اَول = avval
اَوِل = avvel
اوَل = avval
اَوَل = avval
اَوَلْ = avval
...
پارسیگر