Notes and reflections about Siberian Nature

MEMENTO MORI

Previous Entry Share Next Entry
Scopus похоже не знает, что такое юникод
Ааааа!
bolotoved
Просматривая требования Scopus'a для журнала, который хочет в него включиться, заметил единственное странное требование, вызвавшее у меня недоумение и даже, возмущение. Это требование транслитерировать пристатейный список лит-ры на латиницу.

36.02 КБ

То, что, по-видимому, примитивные парсеры Scopus'a не работают c кирилицей и вообще с любым алфавитом, т.е. юникодом, не делают им чести. То, что это технически возможно, говорит яркий пример Google Scholar, который индексирует даже арабскую вязь и иероглифы.

Транслитерация названий статей плодит разные варианты их написания, что, напротив, затруднит идентификацию статьи, сделает как бы множество ее копий. Кроме того, больше ли информации дает транслитерированный текст, чем оригинал на своей глаголице? Есть даже спец. методички, которые на многих страницах разъясняют как транслитерировать на латиницу русские названия! А в статье, в итоге, должно быть два пристатейных списка лит-ры: один на русском, другой - на латинице!

Представим себе, на секундочку, что международным языком науки является русский, а РИНЦ - диктует всему научному сообществу, что пристатейные списки лит-ры надо транслитерировать на русский и получим, к примеру, Блоодсуккинг анд зоофилус.

Искренне не понимаю, нафиг это надо в век юникода?

  • 1
Они совершенно правы. На свете тысячи языков, но языками науки являются немногие, по-хорошему один. На свете много алфавитов, но в науке должен использоваться по любому один. Задача не в том, чтобы быть или не быть способным проиндексировать и воспроизвести. А в том, чтобы ссылка была. Потому что для тех, кто не владеет алфавитом, текста нет, как ты его не воспроизводи. Блоодсуккинг анд зоофилус смешон только потому, что ты знаешь английский и уже хотел бы здесь видеть латиницу, которую ты тоже знаешь То же самое на неизвестном алфавите не только нифига не смешно, но и раздражает. Проведи мысленный эксперимент - ссылки на китайском, корейском, кхмерском, на арабской вязи. С большой натугой, после многих лет естественнонаучного и математического образования, можно отличить одну от другой, и даже прочитать, надписи на греческом. Нужно очень потрудиться, чтобы отличить одну от другой надписи на всем остальном. А трудиться над этим некогда и не нужно. Если же есть абракадабры на привычном алфавите, ты легко отличишь одну от другой - хотя бы блоодсукинг от зоофилуса - и как минимум будешь иметь возможность легко, на автомате, распознать сколько публикаций, различных авторов, годы. Я бы сказал главное - надписи на знакомых алфавитах как-то звучат в голове в виде звуков, и поэтому суть надписи. Надписи на всем остальном - это просто замутные дыры в тексте.

Кириллицу знают в 21 стране, а латиницу - во всех (разве кроме южной кореи). На что транслитерировать - сразу понятно.

Тем более если есть спецметодички, которыми добиваются однозначности транслитерации! Вот за что я всегда воюю не на жизнь а насмерть с соавторами.

Своя - кириллица, а глаголица - это не легче кхмерского и тайского.




Edited at 2014-01-05 05:38 pm (UTC)

Проведи мысленный эксперимент - ссылки на китайском, корейском, кхмерском, на арабской вязи.


Я проведу наглядный, а не мысленный эксперимент автоматического перевода с арабской вязи в юникоде на русский в кириллице (т.о. отделив не только блудсукинг от зоофилуса, но и поняв, о чем вообще речь):
Возьмем что-нибудь на арабской вязи с упоминанием биологии из Google Scholar.
Теперь переведем гуглопереводчиком.

Было: قياس مدى تحقيق طلبة الصف الثاني الثانوي العلمي للاهداف التدريسية لمنهاج علم الاحياء في المرحلة الثانوية‎ (Тут идет вязь, если у тебя не видно, то это проблемы винды).
Стало: "Измерьте достижений учащихся во втором классе средних научных целей Платформы обучения биологии в средней школе"

В случае с транслитерацией, нужно было бы выполнить вначале проц. обратной транслитерации, что привело бы еще к доп. ошибкам!!!

Вязь видна.
Надо же, тебя интересует содержание! Даже интересно, как ты так сохранился. Сейчас статей так много, что их можно успевать читать только по диагонали. По сути, читаешь резюме, а потом в тексте статьи вычиваешь немногие заинтересовавшие детали, выясняешь в обсуждении то, что непонятно изложено в резюме, а также выясняешь общее впечатление о том, насколько можно источнику доверять. Здесь важно, насколько соблюден научный ритуал и насколько он соблюден неформально. Иноязычные ссылки в статье никто читать и переводить не будет. Но каждый хочет попытается оценить насколько они не туфта.

С другой стороны, транслитерация действительно делает ссылку неточной. Я бы давал в списке литературы оба варианта - оригинальный кириллицей и транслитерированный в плане авторов и источника и переведенный в плане названия (с заключением в квадратные скобки) на латинице. Как, собственно, часто и делал.

Сейчас статей так много, что их можно успевать читать только по диагонали.
Да, но, к счастью, часть функций по "диагональному чтению" взял на себя компьютер в виде полнотекстового поиска. В будущем, этот процесс еще более автоматизируется, как именно, сейчас можно только догадываться, см., например карту статей по физике.

Здесь важно, насколько соблюден научный ритуал и насколько он соблюден неформально
Ну ведь, чтобы попасть в скопус нужно удовлетворить огромному количеству требований, причем, несмотря на то, что они гораздо более трудновыполнимы, они разумны и я с ними согласен. В то время как транслитерация - явная недальновидность и сами скопусовчане признают, что из-за сложностей транслитерации, не удается точно идентифицировать около половины (!) ссылок (т.е. ссылки на эти работы не учитываются).

Я бы давал в списке литературы оба варианта - оригинальный кириллицей и транслитерированный в плане авторов и источника и переведенный в плане названия (с заключением в квадратные скобки) на латинице.
Видимо, так и будем делать, потому как рано или поздно от транслитерации (как я уверен) откажутся, хотя, к тому времени, в библиографических БД транслитерацией будет внесено уже огромное количество шума.

  • 1
?

Log in