Частотный анализ текста
Программа BX Language acquisition позволяет Вам автоматически составлять словари на основе частотного анализа текста. Для этого Вам необходимо перейти в закладку Текст основного окна обучения.
На этой же закладке кнопкой "Субтитры" можно
вызвать форму Проекта
словарей из субтитров
к фильмам.
Окно редактора Текста состоит из панели управления текстом, самого текста и панели параметров частотного анализа текста. Кнопки на панели управления текстом позволяют Вам сохранить текст в текстовом файле, открыть текст из текстового файла или создать новый текст. Загрузить текст из файлов других форматов можно через буфер обмена Windows с помощью кнопки Вставить. Вы можете набрать текст вручную и потом сохранить его в новом файле. Редактирование, поиск и замена текста выполняется также как и в стандартном редакторе Windows Блокнот. Вы можете открывать текстовые файлы в кодировке WIN или Unicode. Сохранение новых файлов осуществляется в кодировке Unicode.
Панель параметров частотного анализа текста ограничивает спектр слов Текста для создания частотного словаря. Вы можете ограничить частотный словарь только теми словами, которые встречаются в тексте, начиная с определённого количества раз. Можно ограничить частотный словарь только теми словами, на которые есть перевод в Базовом словаре. Выбрать Базовый словарь можно на панели управления текстом по кнопке Выбрать Базовый словарь. Вы можете отобразить количество повторений слов в тексте, а также создать частотный словарь, упорядоченный по частоте или по встречаемости слов в тексте. Во втором случае слова можно будет учить сначала для первой главы книги, потом для второй и так далее...
Вы можете добавить дополнительные категории в создаваемый частотный словарь. Для этого введите их в поле "добавить категории". Если категорий несколько, то разделите их точкой с запятой (;). Категории будут добавлены в частотный словарь вместе с категориями Базового словаря.
Если Вы установите галочку "формировать пример", то для каждого слова в частотном словаре, будет сформирован пример применения, то есть одно из предложений текста, в котором встретилось данное слово. Если слово встречается в нескольких предложениях, то выбирается предложение средней длины: не более 6-ти слов или не длиннее 50 символов. В случае сортировки по тексту пример применения слова формируется из предложения, в котором это слово встречается впервые. В программе под предложением понимается текст, завершённый следующими символами: точка(.), восклицательный знак(!), вопросительный знак(?), точка с запятой(;).
Внимание!
При использовании этой опции значительно повышаюся
требования программы к ресурсам компьютера.
Например,
при 1Gb оперативной памяти можно пропустить текст объёмом не более 38 Мб или 13
тыс страниц.
Для
создания частотного словаря из текста необходимо выполнить следующие
шаги:
1 - Загрузить
текст в текстовый редактор программы (из файла или буфера обмена
Windows)
2 - Выбрать
Базовый словарь для
подстановки из него перевода и
транскрипции в новый частотный
словарь.
3 - Нажать
кнопку Создать частотный словарь
на панели управления текcтом
4 - В диалоге
создания словаря указать имя частотного словаря.
По окончании частотного анализа текста программа загрузит Новый словарь и перейдёт в закладку Словарь для его просмотра и редактирования. В частотном словаре будут заполнены поля Слово, порядок и Пример в котором отобразится количество повторений слова в тексте (если такая опция включена). Вы можете изменить параметры частотного анализа, после чего пересоздать частотный словарь. Например: ограничить словарь словами, которые повторяются в тексте, начиная от 2 и более раз, или изменить вид сортировки. Для слов Нового словаря, которых нет в Базовом словаре, переводы и транскрипцию нужно будет ввести вручную. Чтобы свести ручную работу к минимуму, в качестве Базового словаря необходимо выбирать самый большой словарь или выставить опцию на панели параметров частотного анализа - только базовые слова.
Вы можете загрузить статистику слов из ранее выученных словарей в Новый словарь.
Вы можете загрузить перевод, транскрипцию или пример использования из других словарей в Новый словарь.