Транслит

View: New views
20 Messages — Rating Filter:   Alert me  
< Prev | 1 - 2 | Next >

Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

Должно решаться просто, согласно документации на iconv, но
echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT
??????

Вопрос: как это поправить или как сделать другими подручными средствами?

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Boris Popov-6 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Согласно документации, там написано can be...

On 17:51 Sat 31 Oct , Alexey Pechnikov wrote:
> Hello!
>
> Должно решаться просто, согласно документации на iconv, но
> echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT
> ??????


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by Sergei Stolyarov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

On Saturday 31 October 2009 20:51:52 Alexey Pechnikov wrote:
AP> Hello!
AP>
AP> Должно решаться просто, согласно документации на iconv, но
AP> echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT
AP> ??????
AP>
AP> Вопрос: как это поправить или как сделать другими подручными средствами?

echo фыва | iconv -f utf-8 -t koi-7
--
Best regards,
Sergei Stolyarov

Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Saturday 31 October 2009 19:35:41 Boris Popov wrote:
> Согласно документации, там написано can be...

В дебиановском man iconv написано, что эта опция есть.
Только вот кривая...

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Saturday 31 October 2009 19:40:48 Sergei Stolyarov wrote:
> AP> Вопрос: как это поправить или как сделать другими подручными средствами?
>
> echo фыва | iconv -f utf-8 -t koi-7

Не подходит - soundex хэш меняется. Например,
$ echo привет | iconv -f utf-8 -t koi-7
PRIWET

но

select soundex('privet');
P613
select soundex('priwet');
P630

И так со многими буквами, "я" и вовсе в "Q" превращается...

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Sergei Stolyarov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

On Saturday 31 October 2009 22:50:01 Alexey Pechnikov wrote:
AP> > echo фыва | iconv -f utf-8 -t koi-7
AP>
AP> Не подходит - soundex хэш меняется. Например,

Тогда не знаю, Видимо, в iconv не зашиты преобразования русских букв. Всякое
типа ©, ®, ™ работает.

--
Best regards,
Sergei Stolyarov

Re: Транслит

by Yuri Kozlov-4 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

On Sat, 31 Oct 2009 23:19:20 +0600
Sergei Stolyarov <sergei.stolyarov@...> wrote:

> On Saturday 31 October 2009 22:50:01 Alexey Pechnikov wrote:
> AP> > echo фыва | iconv -f utf-8 -t koi-7
> AP>
> AP> Не подходит - soundex хэш меняется. Например,
>
> Тогда не знаю, Видимо, в iconv не зашиты преобразования русских букв.
> Всякое типа ©, ®, ™ работает.

Угу, в lib/translit.def на местах с кириллицей пусто.
Почитав http://ru.wikipedia.org/wiki/Транслит понял,
что в транслитерации, как и в кодировках кириллицы (до utf8), у нас есть
куча вариантов.

--
Best Regards,
Yuri Kozlov


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by yuri.nefedov :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

On Sat, 31 Oct 2009, Alexey Pechnikov wrote:

> Hello!
>
> Должно решаться просто, согласно документации на iconv, но
> echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT
> ??????
>
> Вопрос: как это поправить или как сделать другими подручными средствами?
>

  Попробуйте konwert:

> echo $LANG
ru_RU.UTF-8
> echo "по русски" | konwert UTF8-ascii
po russki

  Ю.

Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Sunday 01 November 2009 00:02:30 yuri.nefedov@... wrote:
>   Попробуйте konwert:
>
> > echo $LANG
> ru_RU.UTF-8
> > echo "по русски" | konwert UTF8-ascii
> po russki

Спасибо, самое то!

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Evgeny M. Zubok :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

yuri.nefedov@... writes:

>  Попробуйте konwert:
>
>> echo $LANG
> ru_RU.UTF-8
>> echo "по русски" | konwert UTF8-ascii
> po russki

По-русски "по русски" будет "по-русски". Прошу прощения за
въедливость. :)


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Parent Message unknown Re: Транслит

by Aleksey Cheusov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

 >> On Saturday 31 October 2009 22:50:01 Alexey Pechnikov wrote:
 >> AP> > echo фыва | iconv -f utf-8 -t koi-7
 >> AP>
 >> AP> Не подходит - soundex хэш меняется. Например,
 >>
 >> Тогда не знаю, Видимо, в iconv не зашиты преобразования русских букв.
 >> Всякое типа ©, ®, ™ работает.

> Угу, в lib/translit.def на местах с кириллицей пусто.
> Почитав http://ru.wikipedia.org/wiki/Транслит понял,
> что в транслитерации, как и в кодировках кириллицы (до utf8), у нас есть
> куча вариантов.

До кучи. Есть такая вещь, как latinica.

http://mova.org/~cheusov/pub/latinica

Спецификация, правда, с geocities.com пропала :-(

--
Best regards, Aleksey Cheusov.

Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Tuesday 03 November 2009 13:24:03 Aleksey Cheusov wrote:
> До кучи. Есть такая вещь, как latinica.
>
> http://mova.org/~cheusov/pub/latinica
>
> Спецификация, правда, с geocities.com пропала :-(

А что там с хэшем soundex()? Транслит позволяет по этому хэшу
найти даже ошибочно написанные слова.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Aleksey Cheusov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message


 >> До кучи. Есть такая вещь, как latinica.
 >>
 >> http://mova.org/~cheusov/pub/latinica
 >>
 >> Спецификация, правда, с geocities.com пропала :-(

> А что там с хэшем soundex()? Транслит позволяет по этому хэшу
> найти даже ошибочно написанные слова.

Soundex вообще не имеет отношения к русскому языку.  Сработает ли он
хоть как-то с транлитом - хез.  Он и для английского то работает очень
так себе.  Для генерации фонетического кода существуют намного более
совершенные алгоритмы.

--
Best regards, Aleksey Cheusov.


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Wednesday 04 November 2009 00:20:04 Aleksey Cheusov wrote:
> > А что там с хэшем soundex()? Транслит позволяет по этому хэшу
> > найти даже ошибочно написанные слова.
>
> Soundex вообще не имеет отношения к русскому языку.  Сработает ли он
> хоть как-то с транлитом - хез.  Он и для английского то работает очень
> так себе.  Для генерации фонетического кода существуют намного более
> совершенные алгоритмы.

Soundex с транслитом - работает. И вполне приемлемо. Насчет "намного
более совершенные" - это бабушка надвое сказала. Скорее, более попсовые...

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Serhiy Storchaka-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Alexey Pechnikov wrote:
> Soundex с транслитом - работает. И вполне приемлемо. Насчет "намного
> более совершенные" - это бабушка надвое сказала. Скорее, более попсовые...

Тогда для «транслита» достаточно
tr 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ' 'ABVGDEEZZIIKLMNOPRSTUFKSSSS-I-EUA'

Кстати, мою фамилию иногда записывают так, что никакой Soundex не поможет.


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Wednesday 04 November 2009 11:52:44 Serhiy Storchaka wrote:
> Тогда для «транслита» достаточно
> tr 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ' 'ABVGDEEZZIIKLMNOPRSTUFKSSSS-I-EUA'
>
> Кстати, мою фамилию иногда записывают так, что никакой Soundex не поможет.

Это не транслит. Звучание искажается, если пытаться русскую букву менять на латинскую.
Смысл как раз в том, чтобы сохранить звучание, тогда и soundex работает.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Serhiy Storchaka-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Alexey Pechnikov wrote:
> Это не транслит. Звучание искажается, если пытаться русскую букву менять
> на латинскую. Смысл как раз в том, чтобы сохранить звучание, тогда и
> soundex работает.

Soundex к звучанию русских слов отношения не имеет. Предложенный мною
вариант транслитерации работает с soundex не хуже (а иногда и лучше), чем
традиционные. Пожалуй даже лучше
подойдёт 'ABVKDEEZZIIKLMMABRSDUVKSSSS-I-EUA'.


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Wednesday 04 November 2009 15:28:59 Serhiy Storchaka wrote:
> Soundex к звучанию русских слов отношения не имеет.
> Предложенный мною
> вариант транслитерации работает с soundex не хуже (а иногда и лучше), чем
> традиционные. Пожалуй даже лучше
> подойдёт 'ABVKDEEZZIIKLMMABRSDUVKSSSS-I-EUA'.

А вы, кроме Москвы, где-нибудь еще бывали? К примеру, волгари "окают", и "о"
отнюдь не звучит похоже на "а", в отличие от московского выговора. С другими
заменами тоже весьма спорный вопрос.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Re: Транслит

by Serhiy Storchaka-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Alexey Pechnikov wrote:
> А вы, кроме Москвы, где-нибудь еще бывали? К примеру, волгари "окают", и
> "о" отнюдь не звучит похоже на "а", в отличие от московского выговора. С
> другими заменами тоже весьма спорный вопрос.

Да я и в Москве последний раз был 20 лет назад.

Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие
слова получат одинаковый код — не беда, они отсеются на втором этапе.
Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше
захватить немного лишнего, чем пропустить возможные варианты. Потому-то
soundex игнорирует гласные и h (которая иногда не произносится, а иногда
является модификатором s, c или t), не различает c, k и s (потому лишь, что
английская c иногда произносится как k, а иногда s). Кроме первой буквы,
конечно (но из-за особенностей русского произношения и первые буквы можно
иногда объединять). Если хотите большую избирательность — используйте другие
алгоритмы, более сложные.


--
To UNSUBSCRIBE, email to debian-russian-REQUEST@...
with a subject of "unsubscribe". Trouble? Contact listmaster@...


Re: Транслит

by Alexey Pechnikov-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hello!

On Thursday 05 November 2009 12:04:36 Serhiy Storchaka wrote:

> Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие
> слова получат одинаковый код — не беда, они отсеются на втором этапе.
> Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше
> захватить немного лишнего, чем пропустить возможные варианты. Потому-то
> soundex игнорирует гласные и h (которая иногда не произносится, а иногда
> является модификатором s, c или t), не различает c, k и s (потому лишь, что
> английская c иногда произносится как k, а иногда s). Кроме первой буквы,
> конечно (но из-за особенностей русского произношения и первые буквы можно
> иногда объединять). Если хотите большую избирательность — используйте другие
> алгоритмы, более сложные.

В москве "о" зачастую звучит как "а". В Нижнем Новгороде - как "оо". Потому мне
предложенный вами вариант замен представляется неприемлемым. Это не
привязываясь к реализации самого хэша soundex. Насчет более сложных алгоритмов -
вы можете назвать такие, которые дают лучший результат? Сама по себе сложность
отнюдь не является достоинством. Было бы интересно сравнить.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/
< Prev | 1 - 2 | Next >