128 символов - золотой стандарт!
Apr. 29th, 2026 08:37 amДневник ф(р)енолога
Наблюдая за взаимодействием кожаной и силиконовой рас, не могу удержаться от предварительных наблюдений. Силиконовый ум, LLM (Large Language Model), по-русски БЯМ (Большие Языковые Модели), пыжится и тужится как может. Разные версии, бегущие по разным дорожкам под командой разных тренерских коллективов, буквально каждую неделю глючат всё меньше и меньше. (Дисклэймер: глюки — это не баг, а фича, не хотите глюков — валяйте к Гуглю).
Кожаные умы разделились в своём отношении к БЯМ. Одна часть считает их инструментом огромной мощности, который при надлежащем использовании способен будет совершить революцию в кожаной жизни, сопоставимую с компьютерной революцией. Оговорка про надлежащее использование является ключевой: бензопила — инструмент огромной мощности, но пользу приносит лишь тем, кто умеет с ним работать, а всем остальным скорее принесёт членовред™. Другая часть через губу пренебрежительно смотрит на БЯМ как на "автоговорилку", способную лишь производить тексты, внешне всё меньше отличающиеся от "кожаных" текстов, но в отличие от этих последних никакого смысла не имеющие.
Хорошо бы, если бы сторонники второй точки зрения ещё бы объяснили, что́ есть тот самый смысл, об отсутствии которого они не устают повторять. Увы, надежды на это нет никакой. Объяснить что-нибудь эти скептики ничего не способны в принципе. Прослеживается очень чёткая закономерность: чем сильнее тот или иной кожаный интеллектуал презирает БЯМ, тем короче его собственные контекстные окна.
Вот, извольте парочку примеров. Титан химической мысли херчок-бородавка и никому не известный Митька, собственными словами вообще не бросающийся, за неимением оных.
Наверное, надо какой-нибудь термин придумать для таких лингво-луддитов. МЯМ, например. Или даже УМЯМ. Помните ли вы, когда в какой ситуации действовал лимит в 128 символов, если писать английскими буквами? Целая эпоха УМЯМи умерла, со своим языком и письменностью...
no subject
Date: 2026-04-29 05:49 am (UTC)эта "хуйня" уже водит машину лучше 3сигма
no subject
Date: 2026-04-29 06:48 am (UTC)no subject
Date: 2026-04-29 07:18 am (UTC)no subject
Date: 2026-04-29 07:22 am (UTC)no subject
Date: 2026-04-29 07:31 am (UTC)no subject
Date: 2026-04-29 07:23 am (UTC)а полубоги типо амодея преднамеренно переоценивают, точнее недооценивают латентность общества
no subject
Date: 2026-04-29 07:40 am (UTC)no subject
Date: 2026-04-29 07:48 am (UTC)no subject
Date: 2026-04-29 07:50 am (UTC)Analysis of the Technical "Slang"
This snippet originates from the intersection of High-Frequency Trading (HFT), Hardware Engineering, and AI Safety/Forecasting. It reflects a cynical view of both the masses and the industry elite.
1. The Hardware Conflict: 2 SOC vs. 3 Sigma
2. The "Amodei" Critique
Summary Comparison
no subject
Date: 2026-04-29 07:52 am (UTC)no subject
Date: 2026-04-29 06:10 am (UTC)Не "в отличие", а "как и". Именно поэтому и презирают: скажи мне, в чем ты обвиняешь ближнего, и я скажу, в чем ты виновен.
no subject
Date: 2026-04-29 07:17 am (UTC)no subject
Date: 2026-04-29 07:27 am (UTC)Шутить изволите...
no subject
Date: 2026-04-29 08:00 am (UTC)Но Гугль жалеет нас, кожаных. Он понимает, что в поисковой строке могут быть типичные кожаные ошибки: перпутан порядок слов, перевраны предлоги, союзы и прочие вспомогательные члены цитаты. Поэтому он ради нашего удобства делает честный контекстный поиск на несколько (десятков? сотен? в любом случае ничтожное увеличение объёмов задачи) вариантов поисковой строки.
После чего вступает в игру тот козырной туз, благодаря которому Гугль стал прародителем слова "гуглить" (я не слышал никакого "яндексить" ни разу в жизни). Это pagerank, алгоритм, в соответствии с которым пользователю выдаются упорядоченные результаты поиска. Как их упорядочивать? БЯМ пользуется статистическими вероятностями, извлечёнными из всего корпуса текстов "тренировочной базы". Очень трудно, долго. Собственно, "глюк" - это результат смешения языков: БЯМ засёк два кластера текстов, в которых обсуждается формально один и тот же короткий контекст, но почему-то не рассёк эти два кластера на две изолированные группы, не влияющие одна на другую, а решил их "поженить".
Гуглевский pagerank основан не на лингвистической близости кластеров, а на их логической связности, которую сами кожаные сделали за него, понаставив перекрёстных ссылок. Кожаные сами себе врать не будут, думает Гугль, и упорядочивает ссылки в соответствии с тем, как сами кожаные видят их релевантность.
Ещё раз подчеркну: Гугль упорядочивает найденные им точные ссылки. Вопрос, поместить ли результат на первой странице результатов, где на него (результат) посмотрит кожаный глаз, или оставить на пятидесятой странице, где его никто никогда не увидит - на этом произвол Гугля начинается и заканчивается.
Ни разу я не встречался с "гипотетической ситуацией", когда Гугль говорил бы мне, - поищи вместо той строки поиска, что ты мне задал, принципиально другую, и я тебе накидаю в сто раз больше цитат.
no subject
Date: 2026-04-29 08:10 am (UTC)Если брать, как что-то на первый взгляд неочевидное для конечного пользователя, то и накрутки, SEO и прочее можно причислить к глюкам, не говоря уж о платном поднятии в поиске.
Если с этим разобраться, то это и не глюк, конечно, но это справедливо для всех "глюков". Гугловские - как устроенные им самим, так и для него - разве что чаще (зло)умышленные, ИМХО.
no subject
Date: 2026-04-29 08:46 am (UTC)no subject
Date: 2026-04-29 08:58 am (UTC)no subject
Date: 2026-04-29 09:06 am (UTC)no subject
Date: 2026-04-29 09:30 am (UTC)- Sponsored results - ну тут хотя бы понятно, если они явно отмаркированы. "Если" ;-)
- SEO spam: тут пытаются манипулировать Гуглом, но в итоге что совой об пень, что пнём об сову для конечного пользователя.
- Т.н. "authority bias": когда Гугл выдает первыми ссылки на широко известные сайты новостей и т.п. (CNN, Wiki) - даже в том случае, как пишут, если менее известные источники дают лучшее соответствие.
- Читал, что выше выдача сайтов, с которых Гуглу капает больше рекламных денег (может быть x-talk с пунктом выше).
- Аналогично говорят, что выше выдача ссылок на собственные гугловские сервисы вроде карт, тытруба и пр.
Re: - и глюков не будет вовсе.
Date: 2026-04-29 08:51 am (UTC)no subject
Date: 2026-04-29 07:54 am (UTC)Не стану употреблять гордое и туманное слово "смысл", но замечу (на основании моего скромного пользовательского опыта), что тексты, сгенерированные ИИ, это великолепные, многомерные рефераты, разительно превосходящие всё, что сделал бы рядовой студент-рефератчик. И даже профессор-рефератчик.
Но вы едва ли получите годный результат, если запромптите запрос на какую-нибудь идею/затею, не придуманную кем-нибудь раньше.
Иными словами, задачу по строительству пусть даже самого сложного объекта из кубиков он выполнит превосходно. Но вот предложить и/или сделать какой-нибудь простенький, кривенький кубик не заданной прежде формы -- уже нет.
no subject
Date: 2026-04-29 07:59 am (UTC)no subject
Date: 2026-04-29 08:34 am (UTC)no subject
Date: 2026-04-29 08:32 am (UTC)Я всю свою жизнь думаю, как можно было бы сократить путь кожаного человечка от колыбели до того момента, когда он прорвёт цепочку стереотипов и откроет человечеству новый путь. В основном, конечно, в отношении преподавания математики.
Если б сегодняшних студентов заставляли пройти путём Ньютона, Лейбница, Эйлера и всей хамуллы Бернулли, получение знаний на B.Sc./Math major занимало бы пару десятков лет. Слава богу, мы кроме энтропии, производим ещё изрядное количество негэнтропии и сконденсировали уровень понимания математики (если, конечно, не сводить его к экзаменам на багрут и примерно аналогичные экзамены позже) до реалистического объёма.
Пример (с моей профессиональной) стороны. Нас, студентов мехмата, драли в хвост и в гриву, чтобы мы запомнили массу способов интегрирования в явном виде (функций, дифференциальных уравнений и т.д.). Не прошло и 20 лет, как нарисовались Wolfram с его Mathematica, Mathlab, и ещё десятки компьютерных систем, которые реализуют все известные человечеству алгоритмы. Начиная с явного нахождения базисов Грёбнера в полиномиальных идеалов, до программы CoCoA (Computer Commutative Algebra), которая в каждом конкретном случае решит всё за тебя.
К чему это? К тому, что скрипт для Mathematica или CoCoa становится легальной ссылкой. Ссылаясь на работу (Рабинович, 2025), в которой есть нужный мне результат, я фактически перекладываю часть ответственности на Рабиновича: если концы с концами не сошлись, а я использовал его результат превратно и пришёл к неверным заключениям в своей задаче, Рабинович не виноват ни сном ни духом. С другой стороны, Рабинович внезапно оказывается перед необходимостью ловить меня за жопу и доказывать, что я процитировал его с ошибкам и пробелами.
Использование стандартных скриптов выводит беднягу Рабиновича за скобки срача. Если скрипт работает правильно в этом конкретном месте, и это подтверждено всеми ползьзователями, то все претензии - ко мне. Если нет - товарищ Вольфрам, вот вам ваш Маузер, решайте, кому (символическую) пулю в лоб пустить.