Если это ваш первый визит, рекомендуем почитать справку по форуму. Для размещения своих сообщений необходимо зарегистрироваться. Для просмотра сообщений выберите раздел. |
Статистика слов в русском языке. |
|
Опции темы |
05.06.2007, 13:15 | #1 |
.
|
Статистика слов в русском языке.
Знаете ли вы, что ...
* Средняя длина русского слова составляет 5.28 символа. * Средняя длина предложения в русском языке составляет 10.38 слов. Был взят 1 000 000 слов из разных текстов, и проведён анализ. В презультате были отобраны 5 000 самых часто встречающихся слов. К примеру, "почему" встречается чаще, чем "потому". Если бы иностранец знал эти 5000 слов, он бы смог понять более 80% текста на русском языке. Вот список самых употребляемых прилагательных в русском языке (тут не только прилагательные): маленький больший большой огромный высокий великий небольшой глубокий крупный мелкий низкий большинство глубоко высоко громадный низко крошечный маленько мелко крупнейший крупно низкорослый глубокомысленный высокомерный высокопоставленный высокомерно высокопревосходительство высокомерие высокоблагородие крупнокалиберный большеголовый высокопарный большущий высокогорный мелководье большеглазый глубокоуважаемый мелкота высокоразвитый глубоководный мелковатый |
05.06.2007, 13:23 | #3 |
.
|
лесоруб, 2003 г.
|
05.06.2007, 17:51 | #4 |
Алтнкарсакал
|
хотелось бы узнать, по какому принципу формировалась выборка текстов для статистики
|
05.06.2007, 21:09 | #5 | |
.
|
LesNick Saul,
Цитата:
|
|
05.06.2007, 21:17 | #6 | |
Алтнкарсакал
|
Avanturistka, я это прочитал. Мне интересен состав этих
Цитата:
|
|
05.06.2007, 21:23 | #7 |
.
|
LesNick Saul, не в курсе.
|
05.06.2007, 21:31 | #8 |
Алтнкарсакал
|
Avanturistka, жаль
|
05.06.2007, 21:35 | #9 |
.
|
LesNick Saul, зачем вам?
|
05.06.2007, 21:40 | #10 |
Алтнкарсакал
|
Avanturistka, для расширения кругозора. Просто, используя статистику в другой предметной области, убедился, что от формирования выборки очень сильно зависит конечный результат стат. обработки
|
05.06.2007, 21:44 | #11 |
.
|
LesNick Saul, удачи в поисках.)
|
05.06.2007, 21:47 | #12 | |
мегапиксель
|
Цитата:
|
|
05.06.2007, 22:15 | #13 |
.
|
DeeP, иногда статистика оказывается права.
|
05.06.2007, 22:23 | #14 |
мегапиксель
|
Avanturistka, после вот этих выборок применяют различные методы (а далее и методики) анализа. Такое поверхностное вываливание копипастов - вода водой.
и вопрос: каких текстов? если брать пушкина-лермонтова и иже с ними, то да. "высокопревосходительство" встречается огого как часто, а если ты возьмешь Духлесс Минаева и подобные фолианты - получишь другой результат. |
05.06.2007, 22:26 | #15 | |
Алтнкарсакал
|
Цитата:
|
|
05.06.2007, 22:38 | #16 |
.
|
LesNick Saul, ну пусть так и будет.)
|