1

Тема: О скан-контенте

Хотелось бы пообщаться с имеющими опыт получения контента путем сканирования старых книг.
1. В каких форматах предпочтительней сохранять тексты после распознавания    FineReader'ом?
2. Какие сканеры наиболее удобны для этой цели?
3. Как определить наиболее часто встречающиеся слова и словосочетания в тексте?

Отредактировано prozit (04.03.2010 17:03:24)

2

Re: О скан-контенте

1) обычно в .doc сохраняю, в  ворде разделять заголовками на статьи удобно

3) В textkit, в автометках можно проанализировать