Чорд...
Как же я прусь с этой книги, это сказать нельзя....
Мало того, что частотные словари - это "любимый цвет, любимый размер" из всей специальной литературы, так оно еще и написано так, что ах) Я эту книгу перечитываю в третий раз и вольно пересказываю с добавлением и апдейтом в своем обзоре - и все еще нравится...
Частотные словари используются в лексикографии [тогда-то, тогда-то], например, когда словарь претендует на статистическую объективность своих данных...Мне понравились еще варианты выбора материала для словаря... Это просто песня. Точно, главное - и настолько правда, что даже как-то не по себе XD эволюция частотника)
читать дальше1)Есть желание сделать словарь (не по качеству, не по содержанию прежде всего, а опять-таки по общей длине обследуемых текстов, т.е. по объему выборки) "не хуже", чем у предшественников. Допустим, по текстам общей длиной не менее миллиона словоупотреблений (таких частотных словарей пока немного); есть финансовая поддержка; есть "рабочая сила" и материалы, техника. И главное - обещана публикация неплохим тиражом. Напомним, кстати, что "толстые" словари, обычные и частотные - дело коммерчески невыгодное.
2)Есть желание и "социальный заказ", необходимость которого обществом (точнее, разного уровня управленческими структурами) правда, еще не осознана. Но есть вера и желание. Объем выборки тогда диктуется тем, сколько времени можно продержаться на эктузиазме и бескорыстии составителей. Десятая доля варианта 1, т.е. 100 тысяч словоупотреблений, как будто маловата для коллективного исполнителя. Следовательно, берется интервал (чтобы не выглядело убого) между этими границами.
3)Есть желание у отдельного составителя использовать свой частотный словарь, скажем, для написания кандидатской диссертации. У коллег-предшественников было как будто 150-200 тыс. словоупотреблений, и хватило, претензий не было...
4)Внезапно один или группа будущих частотников открывает для себя, что сделать частотный словарь не очень сложно. Назначаются достаточно скромные выборочные объемы, но затем обнаруживаются трудности всякого рода, работа затухает, не превысив объема в десятки тысяч словоупотреблений...
О расчетах времени будет рассказано в следующем разделе.ну что, последний пункт я уже проходил, не отбило XD
диагноз...