Инструменты сайта


Разные закономерности

Закон Ципфа

Если упорядочить слова языка в порядке их частот (вероятностей появления в языке), то частота $ n_{} $-го по порядку слова для всех не слишком больших значений $ n_{} $ примерно пропорциональна $ 1/n $. Так, если частота появления первого слова списка равна $ p_1 $, то частота появления второго равна $ p_1/2 $, третьего — $ p_1/3 $, и т.д., десятое слово из списка встречается примерно в $ 10 $ раз реже первого. Отношение частоты появления $ m $-го слова к $ n $-му примерно равно $ n/m $ .

Язык песен горбатых и синих китов подчиняются закону частотности Ципфа .

Закон Менцерата-Альтмана

The larger the whole, the smaller its parts.

Увеличение размера лингвистической конструкции влечет за собой уменьшение размера ее составляющих, и наоборот.

Например, чем длиннее слово (измеренное в слогах или морфах), тем короче слоги или морфы звуков.

$$ y=ax^be^{-cx} $$ Здесь $ y $ — размер составляющей части (например, длина слога);

$x$ — размер рассматриваемой лингвистической конструкции (например, число слогов в каждом слове);

$a,b,c$ — положительные константы

Закон Гудхарта

When a measure becomes a target, it ceases to be a good measure

«Когда мера становится целью, она перестает быть хорошей мерой»[1],

потому что становится объектом манипулирования как прямого (фальсификация чисел), так и косвенного (работа исключительно для улучшения этой меры)[2][3]. Так, если экономический показатель становится целевой функцией для проведения экономической политики, прежние эмпирические закономерности, использующие данный показатель, перестают действовать.

shannon/zipf.txt · Последние изменения: 2025/02/25 00:14 — au