Notes and reflections about Siberian Nature

MEMENTO MORI

Previous Entry Share Next Entry
Scopus похоже не знает, что такое юникод
Ааааа!
bolotoved
Просматривая требования Scopus'a для журнала, который хочет в него включиться, заметил единственное странное требование, вызвавшее у меня недоумение и даже, возмущение. Это требование транслитерировать пристатейный список лит-ры на латиницу.

36.02 КБ

То, что, по-видимому, примитивные парсеры Scopus'a не работают c кирилицей и вообще с любым алфавитом, т.е. юникодом, не делают им чести. То, что это технически возможно, говорит яркий пример Google Scholar, который индексирует даже арабскую вязь и иероглифы.

Транслитерация названий статей плодит разные варианты их написания, что, напротив, затруднит идентификацию статьи, сделает как бы множество ее копий. Кроме того, больше ли информации дает транслитерированный текст, чем оригинал на своей глаголице? Есть даже спец. методички, которые на многих страницах разъясняют как транслитерировать на латиницу русские названия! А в статье, в итоге, должно быть два пристатейных списка лит-ры: один на русском, другой - на латинице!

Представим себе, на секундочку, что международным языком науки является русский, а РИНЦ - диктует всему научному сообществу, что пристатейные списки лит-ры надо транслитерировать на русский и получим, к примеру, Блоодсуккинг анд зоофилус.

Искренне не понимаю, нафиг это надо в век юникода?

  • 1
Они совершенно правы. На свете тысячи языков, но языками науки являются немногие, по-хорошему один. На свете много алфавитов, но в науке должен использоваться по любому один. Задача не в том, чтобы быть или не быть способным проиндексировать и воспроизвести. А в том, чтобы ссылка была. Потому что для тех, кто не владеет алфавитом, текста нет, как ты его не воспроизводи. Блоодсуккинг анд зоофилус смешон только потому, что ты знаешь английский и уже хотел бы здесь видеть латиницу, которую ты тоже знаешь То же самое на неизвестном алфавите не только нифига не смешно, но и раздражает. Проведи мысленный эксперимент - ссылки на китайском, корейском, кхмерском, на арабской вязи. С большой натугой, после многих лет естественнонаучного и математического образования, можно отличить одну от другой, и даже прочитать, надписи на греческом. Нужно очень потрудиться, чтобы отличить одну от другой надписи на всем остальном. А трудиться над этим некогда и не нужно. Если же есть абракадабры на привычном алфавите, ты легко отличишь одну от другой - хотя бы блоодсукинг от зоофилуса - и как минимум будешь иметь возможность легко, на автомате, распознать сколько публикаций, различных авторов, годы. Я бы сказал главное - надписи на знакомых алфавитах как-то звучат в голове в виде звуков, и поэтому суть надписи. Надписи на всем остальном - это просто замутные дыры в тексте.

Кириллицу знают в 21 стране, а латиницу - во всех (разве кроме южной кореи). На что транслитерировать - сразу понятно.

Тем более если есть спецметодички, которыми добиваются однозначности транслитерации! Вот за что я всегда воюю не на жизнь а насмерть с соавторами.

Своя - кириллица, а глаголица - это не легче кхмерского и тайского.




Edited at 2014-01-05 05:38 pm (UTC)

Проведи мысленный эксперимент - ссылки на китайском, корейском, кхмерском, на арабской вязи.


Я проведу наглядный, а не мысленный эксперимент автоматического перевода с арабской вязи в юникоде на русский в кириллице (т.о. отделив не только блудсукинг от зоофилуса, но и поняв, о чем вообще речь):
Возьмем что-нибудь на арабской вязи с упоминанием биологии из Google Scholar.
Теперь переведем гуглопереводчиком.

Было: قياس مدى تحقيق طلبة الصف الثاني الثانوي العلمي للاهداف التدريسية لمنهاج علم الاحياء في المرحلة الثانوية‎ (Тут идет вязь, если у тебя не видно, то это проблемы винды).
Стало: "Измерьте достижений учащихся во втором классе средних научных целей Платформы обучения биологии в средней школе"

В случае с транслитерацией, нужно было бы выполнить вначале проц. обратной транслитерации, что привело бы еще к доп. ошибкам!!!

  • 1
?

Log in