1. Skip to Menu
  2. Skip to Content
  3. Skip to Footer>

Частотный анализ текста

Программа BX Language acquisition позволяет Вам автоматически составлять словари на основе частотного анализа текста. Для этого Вам необходимо перейти в закладку Текст основного окна обучения.

На этой же закладке кнопкой Субтитры "Субтитры" можно вызвать форму Проекта словарей из субтитров к фильмам.

Окно редактора Текста состоит из панели управления текстом, самого текста и панели параметров частотного анализа текста. Кнопки на панели управления текстом позволяют Вам сохранить текст в текстовом файле, открыть текст из текстового файла или создать новый текст. Загрузить текст из файлов других форматов можно через буфер обмена Windows с помощью кнопки Вставить. Вы можете набрать текст вручную и потом сохранить его в новом файле. Редактирование, поиск и замена текста выполняется также как и в стандартном редакторе Windows Блокнот. Вы можете открывать текстовые файлы в кодировке WIN или Unicode. Сохранение новых файлов осуществляется в кодировке Unicode.

Частотный анализ

Панель параметров частотного анализа текста ограничивает спектр слов Текста для создания частотного словаря. Вы можете ограничить частотный словарь только теми словами, которые встречаются в тексте, начиная с определённого количества раз. Можно ограничить частотный словарь только теми словами, на которые есть перевод в Базовом словаре. Выбрать Базовый словарь можно на панели управления текстом по кнопке Выбрать Базовый словарь. Вы можете отобразить количество повторений слов в тексте, а также создать частотный словарь, упорядоченный по частоте или по встречаемости слов в тексте. Во втором случае слова можно будет учить сначала для первой главы книги, потом для второй и так далее...

Вы можете добавить дополнительные категории в создаваемый частотный словарь. Для этого введите их в поле "добавить категории". Если категорий несколько, то разделите их точкой с запятой (;). Категории будут добавлены в частотный словарь вместе с категориями Базового словаря.

Если Вы установите галочку "формировать пример", то для каждого слова в частотном словаре, будет сформирован пример примемения, то есть одно из предложений текста, в котором встретилось данное слово. Если слово встречается в нескольких предложениях, то выбирается предложение средней длины: не более 9-ти слов или не длиннее 80 символов. В программе под предложением понимается текст, завершённый следующими символами: точка(.), восклицательный знак(!), вопросительный знак(?), точка с запятой(;).

Внимание!
При использовании этой опции значительно повышаюся требования программы к ресурсам компьютера.
Например, при 1Gb оперативной памяти можно пропустить текст объёмом не более 38 Мб или 13 тыс страниц.

Для создания частотного словаря из текста необходимо выполнить следующие шаги:
      1 - Загрузить текст в текстовый редактор программы (из файла или буфера обмена Windows)
      2 - Выбрать Базовый словарь для подстановки из него перевода и транскрипции в новый частотный словарь.
      3 - Нажать кнопку Создать частотный словарь на панели управления текcтом
      4 - В диалоге создания словаря указать имя частотного словаря.

По окончании частотного анализа текста программа загрузит Новый словарь и перейдёт в закладку Словарь для его просмотра и редактирования. В частотном словаре будут заполнены поля Слово, порядок и Пример в котором отобразится количество повторений слова в тексте (если такая опция включена). Вы можете изменить параметры частотного анализа, после чего пересоздать частотный словарь. Например: ограничить словарь словами, которые повторяются в тексте, начиная от 2 и более раз, или изменить вид сортировки. Для слов Нового словаря, которых нет в Базовом словаре, переводы и транскрипцию нужно будет ввести вручную. Чтобы свести ручную работу к минимуму, в качестве Базового словаря необходимо выбирать самый большой словарь или выставить опцию на панели параметров частотного анализа - только базовые слова.

Вы можете загрузить статистику слов из ранее выученных словарей в Новый словарь.

Вы можете загрузить перевод, транскрипцию или пример использования из других словарей в Новый словарь.