|
View:
New views
20 Messages
—
Rating Filter:
Alert me
|
| < Prev | 1 - 2 | Next > |
|
|
ТранслитHello!
Должно решаться просто, согласно документации на iconv, но echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT ?????? Вопрос: как это поправить или как сделать другими подручными средствами? Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитСогласно документации, там написано can be...
On 17:51 Sat 31 Oct , Alexey Pechnikov wrote: > Hello! > > Должно решаться просто, согласно документации на iconv, но > echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT > ?????? -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитOn Saturday 31 October 2009 20:51:52 Alexey Pechnikov wrote:
AP> Hello! AP> AP> Должно решаться просто, согласно документации на iconv, но AP> echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT AP> ?????? AP> AP> Вопрос: как это поправить или как сделать другими подручными средствами? echo фыва | iconv -f utf-8 -t koi-7 -- Best regards, Sergei Stolyarov |
|
|
Re: ТранслитHello!
On Saturday 31 October 2009 19:35:41 Boris Popov wrote: > Согласно документации, там написано can be... В дебиановском man iconv написано, что эта опция есть. Только вот кривая... Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитHello!
On Saturday 31 October 2009 19:40:48 Sergei Stolyarov wrote: > AP> Вопрос: как это поправить или как сделать другими подручными средствами? > > echo фыва | iconv -f utf-8 -t koi-7 Не подходит - soundex хэш меняется. Например, $ echo привет | iconv -f utf-8 -t koi-7 PRIWET но select soundex('privet'); P613 select soundex('priwet'); P630 И так со многими буквами, "я" и вовсе в "Q" превращается... Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитOn Saturday 31 October 2009 22:50:01 Alexey Pechnikov wrote:
AP> > echo фыва | iconv -f utf-8 -t koi-7 AP> AP> Не подходит - soundex хэш меняется. Например, Тогда не знаю, Видимо, в iconv не зашиты преобразования русских букв. Всякое типа ©, ®, ™ работает. -- Best regards, Sergei Stolyarov |
|
|
Re: ТранслитOn Sat, 31 Oct 2009 23:19:20 +0600
Sergei Stolyarov <sergei.stolyarov@...> wrote: > On Saturday 31 October 2009 22:50:01 Alexey Pechnikov wrote: > AP> > echo фыва | iconv -f utf-8 -t koi-7 > AP> > AP> Не подходит - soundex хэш меняется. Например, > > Тогда не знаю, Видимо, в iconv не зашиты преобразования русских букв. > Всякое типа ©, ®, ™ работает. Угу, в lib/translit.def на местах с кириллицей пусто. Почитав http://ru.wikipedia.org/wiki/Транслит понял, что в транслитерации, как и в кодировках кириллицы (до utf8), у нас есть куча вариантов. -- Best Regards, Yuri Kozlov -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитOn Sat, 31 Oct 2009, Alexey Pechnikov wrote:
> Hello! > > Должно решаться просто, согласно документации на iconv, но > echo "привет" |iconv -f UTF-8 -t ASCII//TRANSLIT > ?????? > > Вопрос: как это поправить или как сделать другими подручными средствами? > Попробуйте konwert: > echo $LANG ru_RU.UTF-8 > echo "по русски" | konwert UTF8-ascii po russki Ю. |
|
|
Re: ТранслитHello!
On Sunday 01 November 2009 00:02:30 yuri.nefedov@... wrote: > Попробуйте konwert: > > > echo $LANG > ru_RU.UTF-8 > > echo "по русски" | konwert UTF8-ascii > po russki Спасибо, самое то! Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: Транслитyuri.nefedov@... writes:
> Попробуйте konwert: > >> echo $LANG > ru_RU.UTF-8 >> echo "по русски" | konwert UTF8-ascii > po russki По-русски "по русски" будет "по-русски". Прошу прощения за въедливость. :) -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
|
|
|
Re: ТранслитHello!
On Tuesday 03 November 2009 13:24:03 Aleksey Cheusov wrote: > До кучи. Есть такая вещь, как latinica. > > http://mova.org/~cheusov/pub/latinica > > Спецификация, правда, с geocities.com пропала :-( А что там с хэшем soundex()? Транслит позволяет по этому хэшу найти даже ошибочно написанные слова. Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: Транслит>> До кучи. Есть такая вещь, как latinica. >> >> http://mova.org/~cheusov/pub/latinica >> >> Спецификация, правда, с geocities.com пропала :-( > А что там с хэшем soundex()? Транслит позволяет по этому хэшу > найти даже ошибочно написанные слова. Soundex вообще не имеет отношения к русскому языку. Сработает ли он хоть как-то с транлитом - хез. Он и для английского то работает очень так себе. Для генерации фонетического кода существуют намного более совершенные алгоритмы. -- Best regards, Aleksey Cheusov. -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитHello!
On Wednesday 04 November 2009 00:20:04 Aleksey Cheusov wrote: > > А что там с хэшем soundex()? Транслит позволяет по этому хэшу > > найти даже ошибочно написанные слова. > > Soundex вообще не имеет отношения к русскому языку. Сработает ли он > хоть как-то с транлитом - хез. Он и для английского то работает очень > так себе. Для генерации фонетического кода существуют намного более > совершенные алгоритмы. Soundex с транслитом - работает. И вполне приемлемо. Насчет "намного более совершенные" - это бабушка надвое сказала. Скорее, более попсовые... Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитAlexey Pechnikov wrote:
> Soundex с транслитом - работает. И вполне приемлемо. Насчет "намного > более совершенные" - это бабушка надвое сказала. Скорее, более попсовые... Тогда для «транслита» достаточно tr 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ' 'ABVGDEEZZIIKLMNOPRSTUFKSSSS-I-EUA' Кстати, мою фамилию иногда записывают так, что никакой Soundex не поможет. -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитHello!
On Wednesday 04 November 2009 11:52:44 Serhiy Storchaka wrote: > Тогда для «транслита» достаточно > tr 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ' 'ABVGDEEZZIIKLMNOPRSTUFKSSSS-I-EUA' > > Кстати, мою фамилию иногда записывают так, что никакой Soundex не поможет. Это не транслит. Звучание искажается, если пытаться русскую букву менять на латинскую. Смысл как раз в том, чтобы сохранить звучание, тогда и soundex работает. Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитAlexey Pechnikov wrote:
> Это не транслит. Звучание искажается, если пытаться русскую букву менять > на латинскую. Смысл как раз в том, чтобы сохранить звучание, тогда и > soundex работает. Soundex к звучанию русских слов отношения не имеет. Предложенный мною вариант транслитерации работает с soundex не хуже (а иногда и лучше), чем традиционные. Пожалуй даже лучше подойдёт 'ABVKDEEZZIIKLMMABRSDUVKSSSS-I-EUA'. -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитHello!
On Wednesday 04 November 2009 15:28:59 Serhiy Storchaka wrote: > Soundex к звучанию русских слов отношения не имеет. > Предложенный мною > вариант транслитерации работает с soundex не хуже (а иногда и лучше), чем > традиционные. Пожалуй даже лучше > подойдёт 'ABVKDEEZZIIKLMMABRSDUVKSSSS-I-EUA'. А вы, кроме Москвы, где-нибудь еще бывали? К примеру, волгари "окают", и "о" отнюдь не звучит похоже на "а", в отличие от московского выговора. С другими заменами тоже весьма спорный вопрос. Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
|
|
Re: ТранслитAlexey Pechnikov wrote:
> А вы, кроме Москвы, где-нибудь еще бывали? К примеру, волгари "окают", и > "о" отнюдь не звучит похоже на "а", в отличие от московского выговора. С > другими заменами тоже весьма спорный вопрос. Да я и в Москве последний раз был 20 лет назад. Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие слова получат одинаковый код — не беда, они отсеются на втором этапе. Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше захватить немного лишнего, чем пропустить возможные варианты. Потому-то soundex игнорирует гласные и h (которая иногда не произносится, а иногда является модификатором s, c или t), не различает c, k и s (потому лишь, что английская c иногда произносится как k, а иногда s). Кроме первой буквы, конечно (но из-за особенностей русского произношения и первые буквы можно иногда объединять). Если хотите большую избирательность — используйте другие алгоритмы, более сложные. -- To UNSUBSCRIBE, email to debian-russian-REQUEST@... with a subject of "unsubscribe". Trouble? Contact listmaster@... |
|
|
Re: ТранслитHello!
On Thursday 05 November 2009 12:04:36 Serhiy Storchaka wrote: > Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие > слова получат одинаковый код — не беда, они отсеются на втором этапе. > Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше > захватить немного лишнего, чем пропустить возможные варианты. Потому-то > soundex игнорирует гласные и h (которая иногда не произносится, а иногда > является модификатором s, c или t), не различает c, k и s (потому лишь, что > английская c иногда произносится как k, а иногда s). Кроме первой буквы, > конечно (но из-за особенностей русского произношения и первые буквы можно > иногда объединять). Если хотите большую избирательность — используйте другие > алгоритмы, более сложные. В москве "о" зачастую звучит как "а". В Нижнем Новгороде - как "оо". Потому мне предложенный вами вариант замен представляется неприемлемым. Это не привязываясь к реализации самого хэша soundex. Насчет более сложных алгоритмов - вы можете назвать такие, которые дают лучший результат? Сама по себе сложность отнюдь не является достоинством. Было бы интересно сравнить. Best regards, Alexey Pechnikov. http://pechnikov.tel/ |
| < Prev | 1 - 2 | Next > |
| Free embeddable forum powered by Nabble | Forum Help |