Словари

Cool Reader
Post Reply
sergeyvl
Posts: 1614
Joined: Sun Nov 13, 2011 5:43 pm
My ELO: 1700-1800
Location: Харьков
Contact:

Словари

Post by sergeyvl » Fri Mar 13, 2015 8:12 am

Предлагаю в этой теме выкладывать ссылки на словари в формате StarDict которые хорошо работают с CR.

sergeyvl
Posts: 1614
Joined: Sun Nov 13, 2011 5:43 pm
My ELO: 1700-1800
Location: Харьков
Contact:

Re: Словари

Post by sergeyvl » Fri Mar 13, 2015 12:23 pm

Вот торрент-раздача. Сегодня попробовал - в принципе работает с кулридером.

http://rutracker.org/forum/viewtopic.php?t=1576913

Правда словари в нужно извлекать из deb - файлов.

gredik
Posts: 23
Joined: Tue Sep 17, 2013 10:49 am
My ELO: I don't know

Re: Словари

Post by gredik » Sat Apr 04, 2015 5:44 am


Metazoa
Posts: 130
Joined: Wed Apr 29, 2015 1:01 pm
My ELO: I don't know
Location: Одесса

Re: Словари

Post by Metazoa » Wed Apr 29, 2015 6:50 pm

Пытаюсь прикрутить википедические словари из этой раздачи.
Сразу столкнулся с тем, что словари здоровые, на внутреннюю память не влазят.
Ну ладно, перенес папку dictionary на sd, подшаманил в dictionary.sh - оболочка запускается, но на все вопросы получаю "nothing similar to..."
То ли словари здоровые, то ли хз...

PS А сделать альтернативную папку для больших словарей на SD все же было бы неплохо.
Kobo Aura One

Metazoa
Posts: 130
Joined: Wed Apr 29, 2015 1:01 pm
My ELO: I don't know
Location: Одесса

Re: Словари

Post by Metazoa » Sat May 02, 2015 7:06 pm

В общем, с википедией все понятно:

Code: Select all

[root@(none) dictionary]# ./sdcv --data-dir . --utf8-input
save to cache ./ruwiki-20140215-01.idx
save to cache ./ruwiki-20140215-02.idx
save to cache ./ruwiki-20140215-03.idx
Segmentation fault
Но неплохо бы пересобрать sdcv из свежайшей беты, потому что:

Code: Select all

[root@(none) dictionary]# ./sdcv -v
Console version of Stardict, version 0.4.2
, а тем временем:

Code: Select all

Changes

Version 0.5.0-beta2
- add option to colorize output
- Roman Imankulov's patch to better use of readline
- Fix build with modern compilers
- Fix work on CPU with align issues, like ARM and SPARC (thanks to Michal Čihař )
- Migrate to C++11 and CMake (so at now archive with code 180K->54K)
- Update Russian translation
PS Я бы и сам пересобрал, да там компилить с нуля под ARM все зависимости, окружение и либы, а это время...
Kobo Aura One

Metazoa
Posts: 130
Joined: Wed Apr 29, 2015 1:01 pm
My ELO: I don't know
Location: Одесса

Re: Словари

Post by Metazoa » Tue May 05, 2015 10:00 am

Продолжаю разбираться с Википедией.
Кажется, все грустно.
И в stardict-editor и в sdcv есть ограничение на размер статьи, причем недокументированное.
Кроме того, sdcv слишком примитивен. Разумеется никакого html в статьях, но он еще и мешает в своем выводе содержания статей и свои технические строки (saving to cache..., например).
В общем, оно и в таком виде как-то работает (но пока не Википедия, увы), но хочется сильно большего.
В идеале - собрать GoldenDict с оболочкой. По идее, Qt для него родная среда. Хотя, конечно, трудозатраты будут приличными.
Kobo Aura One

sergeyvl
Posts: 1614
Joined: Sun Nov 13, 2011 5:43 pm
My ELO: 1700-1800
Location: Харьков
Contact:

Re: Словари

Post by sergeyvl » Tue May 05, 2015 10:05 am

Metazoa wrote:Продолжаю разбираться с Википедией.
Кажется, все грустно.
И в stardict-editor и в sdcv есть ограничение на размер статьи, причем недокументированное.
Кроме того, sdcv слишком примитивен. Разумеется никакого html в статьях, но он еще и мешает в своем выводе содержания статей и свои технические строки (saving to cache..., например).
В общем, оно и в таком виде как-то работает (но пока не Википедия, увы), но хочется сильно большего.
В идеале - собрать GoldenDict с оболочкой. По идее, Qt для него родная среда. Хотя, конечно, трудозатраты будут приличными.
Может быть дойдут до этого руки, может и нет. Они используют Qt4+WebKit. При чем при беглом просмотре GUI от движка отделить не смог. Я же планирую переходить на Qt5...

Metazoa
Posts: 130
Joined: Wed Apr 29, 2015 1:01 pm
My ELO: I don't know
Location: Одесса

Re: Словари

Post by Metazoa » Mon May 11, 2015 7:58 am

Все же удалось прикрутить википедию к текущей реализации словарей.
Качаем
Зеркало
Инструкция по пользованию: распаковать zip-архив в папку dictionary пакета.
При первом запуске словаря отдельно или из CR перед статьей появится пачка надписей saving to cache.... Это нормально, при повторных вызовах повторяться не должно.
Так как Википедия адаптирована под текстовый sdcv, неизбежны некоторые ограничения в этой версии, а именно:
- выпилен весь HTML. все таблицы, ссылки (включая перекрестные между статьями), стили и прочие рюшечки веба отсутствуют. оставлен чистый текст;
- размер статей обрезан до 10 кбайт. увы, но иначе такой википедией невозможно было бы не только пользоваться, но даже и собрать ее в формате stardict.
Нечеткий поиск в stardict и sdcv уже более-менее реализован, поэтому мою предыдущую просьбу о морфологии аннулируем.

PS Если у кого есть информация о том как из файла нового формата AARD .slob сделать tab-file для компиляции в Stardict - просьба поделиться знанием. Тем кто ничего не понял в этой фразе - просьба не беспокоиться. :P

PPS Размер шрифта словаря меняется так - в файл eink.qss добавляем (размер, конечно, можно крутить самостоятельно):

Code: Select all

/* Popup dictionary window */
DictionaryWidget {
	font-size: 8pt;
}
Kobo Aura One

sergeyvl
Posts: 1614
Joined: Sun Nov 13, 2011 5:43 pm
My ELO: 1700-1800
Location: Харьков
Contact:

Re: Словари

Post by sergeyvl » Wed May 13, 2015 6:22 am

Metazoa, спасибо за ваш подарочек!

Кстати, можете мне скинуть пример словаря который выдавал бы html - разметку? В Qt есть ограниченная поддержка html (WebKit с полной поддержкой пока прикручивать не хочу но придется если хотим Golden Dict), может получится использовать.

Metazoa
Posts: 130
Joined: Wed Apr 29, 2015 1:01 pm
My ELO: I don't know
Location: Одесса

Re: Словари

Post by Metazoa » Wed May 13, 2015 9:54 pm

Пример - кусок той же самой Википедии.
В архиве есть исходник .txt, чтобы видеть доступные статьи, да и собственно разметку.

PS Обратите внимание - достаточно много статей с содержимым <a href="..."></a> - это перенаправления на другие статьи википедии. В sdcv оно, конечно, не будет работать, поэтому я в текстовой реализации без html такие статьи поудалял.
Kobo Aura One

Post Reply