• Таб About

    У всех медиа-платформ один и тот же косяк.

    Предположим, я кликаю на ссылку исполнителя, и открывается страница с табами. При этом нулевым, главным табом является “About” или “Info” — общая информация об исполнителе. Так вот — этот таб не нужен. В нем нет ничего полезного, и он целиком дублирует контент из других табов, например “Видео” или “Треки”.

    Пример — Яндекс.Музыка. На странице “Главное” — популярные треки. На странице “Треки” — те же самые треки в той же последовательности, отличается только рендер. На “Главной” перед треками иконки альбома, в “Треках” иконок уже нет.

    Главная:

    Треки:

    В чем разница?

    То же самое в Ютубе или, прости господи, Порнохабе. На главном табе какой-то хлам, который никому не нужен. Никто не читает графоманию автора о себе и своем канале. От промо-ролика на главной уже тошнит. Каждый зритель хочет контент — то есть таб “Видео”. Получается два клика вместо одного: сперва на ссылку исполнителя, а потом /video.

    Именно таб с контентом должен быть главным, а “About” или “Info” нужно задвинуть в конец. Это как если бы главной страницей сайта была “О компании”. Глупо? Так почему же везде копируют этот паттерн?

  • Джек Торранс

    Отпуск, перечитываю “Сияние” Стивена Кинга. Та самая книга из детства: суперобложки давно нет, зеленая корка без каких-либо надписей. Перевод местами странный, на каждой третьей странице — опечатка или путаница имен. Но это та самая книга, которую я читал двадцать пять лет назад, поэтому можно закрыть глаза.

    Удивительно, как меняется восприятие книги с возрастом. В детстве я обращал внимание в основном на крипоту, а теперь — на проработку персонажей. На мой взгляд, “Сияние” особенно сильно с этой стороны. Центральные персонажи — Джек, Венди и Денни — переданы столь качественно, что лучше и нельзя. Читая роман, буквально погружаешься в персонажей, в их тесный семейный мир.

    На фоне жены и сына лучше всего, на мой, взгляд, проработан Джек. Действие отталкивается от него, и мы узнаем все больше деталей из его прошлого. Джек — крайне сложный, противоречивый персонаж. Его амбиции стать писателем подкошены алкоголизмом. Роль главы семьи тоже под вопросом — пьяный Джек сломал сыну руку. И хотя проблемы от алкоголя в прошлом, каждый поступок рождает флешбек, когда Джек пил.

    Мне не доводилось читать книги, в которой более точно описано состояние человека после алкоголизма. Я имею в виду не краткосрочные последствия вроде протрезвления или развода. Я говорю о более длинном куске жизни — три, пять и более лет. Алкоголизм, даже когда отступил, продолжает давить на человека. Далеко не каждый думает об этом периоде, когда проблема, казалось бы, позади, но на самом деле впереди долгий путь адаптации. Это то, что в драматургии называется “ложный конец”.

    Я, хоть и не страдал алкоголизмом (вообще не люблю алкоголь), могу рассказать свою историю. Лет двадцать назад я был знаком с человеком, бывшим в юности алкоголиком. Мы вместе работали и даже пытались делать бизнес.

    У человека был сложный характер: это был ходячий комок комплексов, переживаний, подозрений, ревности и много чего еще. Он находил интриги там, где все было чисто. Своим поведением он привлекал женщин, заводил бесконечные романы, которые кончались разрывом в слезах. Многое можно было списать на характер, но на мой взгляд, алкоголизм выступил тем катализатором, который многократно обострил его неприятные черты.

    Ключевой особенностью этого человека можно назвать обиду. Он жил обидой на то, что пока он пил, кто-то учился и шел на повышение. Он был обижен на жизнь, в которой он потерял самые важные годы. В таком мире все были виноваты: коллеги, начальники, друзья, женщины.

    Насколько я знаю, сейчас у него все хорошо — есть семья и дети, он профессионал в своем деле. Мы были знакомы пять лет или около того, и по моим оценкам, восстановление от алкоголя занимает около десяти лет. Сколько раз я слышал от него про желание напиться; различные уловки, чтобы избежать этого; россказни про собрания анонимных алкоголиков и все остальное. Этот груз давит, его вечно носишь с собой, как Джек Торранс носил свой набор досадных воспоминаний.

    Рассказы этого человека дословно повторяют жизнь Джека Торранса. Чувство обиды постоянно угнетало его. Оно чередуется с обидой внутренней — на себя — с обидой внешней на семью и коллег. Почти каждый шаг Джека — это реакция на очередной флешбек, попытка отыграть то, что не удалось тогда, и вот теперь-то выйдет как надо. Но даже когда дела идут, Джек, движимый обидой, звонит Уллману и раскрывает планы на книгу про отель. Этот звонок обходится ему дорого: именно с ответного звонка Эла Шокли психика Джека начинает расшатываться. Подобно Джеку, мой знакомый ссорился с людьми на ровном месте, воскрешая из памяти забытые эпизоды, обильно удобряя их обидой.

    Ключевая причина того, что бывший алкоголик ведет себя странно — обида. А мир, в котором все наполнено обидой, неблагополучен для жизни.

    Удивляться тому, как точно автор передал Джека Торранса, не приходится. Джек — это сам Кинг, который в ту пору восстанавливался от алкоголя. Он был в точности на том же отрезке пути, когда приемы спиртного уже в прошлом, но человек может в любую минуту сорваться. Вот откуда эта точность, эта интимность всех помыслов Джека и его флешбеков. Вот почему, читая главы “Сияния”, особенно связанные с Джеком, отключаешься от внешнего мира — настолько сильно погружение.

    Завершая, скажу, что все сказанное выше относится к книге. Фильм Кубрика я считаю парадоксом: с одной стороны, великолепно подобранные актеры: на месте тех Джека, Венди и Денни я физически не могу представить кого-либо другого. Сам фильм — некая фантасмагория, в которой от замысла Кинга не осталось ничего. Будет время — горячо советую прочитать книжку.

  • Zen of Python

    Если вы имеете отношение к Питону, то вот небольшой совет. Никогда не упоминайте знаменитый Zen of Python: ни в шутку, ни всерьез. Если упоминает кто-то другой, пропускайте мимо ушей, не важно насколько он именит.

    Объяснение этому следующее. Современный Питон бесконечно далек от тезисов Zen of Python. Я заметил это пятнадцать лет назад, когда писал на Python 2.5. Тогда я не мог высказаться, но время пришло.

    Я не говорю, что это плохо. Наоборот, Питон — одна из лучших вещей в айти (иногда мне кажется, что слишком хорошая). Питон — первый язык, ориентированный на пользователя. Отсюда такая любовь и популярность.

    Расхождение с Zen of Python было неминуемым, потому что язык развивался. Полагаю, Zen of Python был актуален несколько первых версий, а потом устарел — не быть же языку заложником старых догм. Это совершенно нормально.

    Поэтому я рассматриваю Zen of Python как исторический документ. Подкреплять им свои доводы в спорах несерьезно. С таким же успехом можно ссылаться на скрижали Майя или гороскоп.

    Половина доводов в Zen of Python не имеет смысла, а вторая потеряла актуальность. Я не буду дотошно перечислять каждый пункт: повторюсь, половина из них бессмысленна. Я не знаю, как комментировать “красивое лучше, чем уродливое” — с таким же успехом можно сказать, что котики лучше пьяной драки. Зато знаю, какие пункты прямо нарушают то, что в Питоне, и сейчас вам о них расскажу.

    Один из тезисов звучит примерно как “должен быть один способ сделать что-то”:

    There should be one– and preferably only one –obvious way to do it

    Когда я слышу это утверждение, то могу только фыркнуть. В Питоне бесконечное число способов что-то сделать. Из-за своей гибкости и многолетнего контриба одну и ту же задачу можно выполнить разными способами. При этом число способов со временем только множится.

    Простой пример — в Питоне три способа форматирования строк: старый сишный с процентом, джавный string.format() и f-строки, которые по сути eval. Я обожаю троллить питонистов форматированием с процентом. Если вы возьмете меня в проект на Питоне, я обязательно напишу так:

    return "<%s %s>" % (user_name, user_email, )
    

    Не потому что я упорот, а чтобы проверить вашу реакцию. Происходит следующее: коллега читает код и подвисает на этой строчке. Его уже не волнует бизнес-логика и покрытие тестов. В нем зреет тревога: всем известно, что нужно пользоваться f-строками, а тут какой-то синтаксис времен Unix… Подключается второй питонист, слово за слово, и начинается срач — как правильно форматировать строки. Плывут экраны комментариев, я сижу и улыбаюсь.

    Библиотеки с говорящими именами httplib и httplib2, а также urllib, urllib2 и urllib3 (последняя — сторонняя). Все они страшные, и нормальную открывашку урлов сделали только в requests.

    У словаря есть метод update. Добавили оператор |= (палка-равно), который делает то же самое. Господи, зачем? Может, добавите еще |>, |~, |- и другие? Удобней и короче, чем .update, .intersect и прочие английские слова.

    С каждый релизом в Питоне все больше трюков, библиотек и операторов. Забавно, когда одна строчка from __future__ import foo расширяет синтаксис или даже интерпретатор.

    Словом, тезис о том, что должен быть один способ что-то сделать, совершенно неактуален.

    Другие тезисы Zen of Python вроде как поощряют простые решения:

    Explicit is better than implicit. Simple is better than complex. Flat is better than nested.

    Давайте откроем исходники Django Framework, а именно его сердце — модели. Потому что в Django все вращается вокруг моделей — пользователи, данные, админка — и без моделей он никому не нужен.

    Смотрим класс ModelBase, метод __new__(): семь экранов магии. Здесь и махинации с атрибутами, и прокси-классами, и наследование, и то, и се вперемешку с многими if-else. Найдется ли питонист, который внятно объяснит, что там происходит?

    Но ModelBase — это всего лишь метакласс класса Model, в котором похожая петрушка. В методе __init__ четыре экрана кода с разными манипуляциями с аргументами. И этот код со всей своей магией постоянно крутится у тех, кто ведет проекты на Django.

    Ничуть не лучше ситуация с формами и виджетами. Там тоже метаклассы с махинациями, которые простым смертным не понять.

    Я веду к следующему: чтобы сделать удобно потребителю, код может быть чудовищно сложным. Но потребитель об этом не знает: он вызывает методы и рассказывает догмы из Zen of Python, что simple is better than complex. То, что внутри экраны магии с метаклассами, его не интересует.

    Другой довод в пользу того, что в Питоне не приживаются простые решения, следующей. Если бы это было так, то проекты на Питоне строили бы на списках, словарях и функциях. А на практике любой проект на Питоне — как Джава: классы, классы, классы. Гигантский граф изменяемых объектов.

    Еще один пункт из Zen of Python говорит про неймспейсы:

    Namespaces are one honking great idea – let’s do more of those!

    Если кто-то знает о пространствах имен в Питоне, пожалуйста, сообщите мне, потому что за 10 лет я о них ничего не узнал. В Питоне обычная система модулей, которые импортируются друг в друга. Никаких особых свойств у модулей нет.

    Для сравнения: в известном скобочном языке символы и кейворды могут быть привязаны неймспейсу. Символ foo из неймспейса com.test не равен символу foo из bar.test. Такая связь пространства имен и символов/кейвордов открывает полезные техники, о которых я не буду сейчас, потому что это другой язык. В Питоне ничего подобного нет, и к чему тезис о неймспейсах, непонятно.

    Повторюсь, бессмысленность Zen of Python не имеет отношения к языку. Можно писать на нем отличный код, даже не зная о Дзене. Но доказывать точку зрения, опираясь на тезисы Zen of Python — вот образец бессмысленности.

  • Винда и Скайнет

    То, что произошло недавно с виндой, напоминает Скайнет из франшизы про Терминатора. Напомню, по сюжету все компьютеры захватил вирус. Далее он построил роботов, которые пошли убивать людей. На тот момент это было слишком фантастично, потому что единовременно обрушить все компьютеры в те дни было невозможно. Не было такой связанности и централизованности. Не было такого, что каждый утюг качает обновления по три раза в день и ставит автоматом.

    А сегодня — пожалуйста! Какие-то бедолаги налажали с указателями, и легла сотая часть компов на виндузе. Если вам кажется, то это мало, то вы не правы. В одном только здании может быть нескольких сотен устройств на винде. Тем сотым компом, что лег из-за обновления, может быть кассовый сервер в Пятерочке, банкомат, шлагбаум на вокзале, дашборд службы спасения.

    Это наводит на рассуждения. Были же истории с пилотами, которые нарочно гробили себя и сотни пассажиров. Порой я думаю: вдруг найдется такой же маньяк, только в цифровой сфере? Кто-то, кто устроит цифровой Judgement Day. Он выпустит обновление, которое разойдется по всем виндовым компам, подождет годик-другой и потом вжух — затрет файлы нулями, подаст напряжение на USB-порты, разгонит видеокарты, словом — сделает максимум деструктива.

    Все это фантазии, но проблема в том, что они уже не так фантастичны, как в терминаторе. Теоретически они стали возможны, и Микрософт сотоварищи это доказали.

  • Как наполнить базу сгенерированными джейсонами

    Предположим, у вас Postgres с миллионами JSONb-документов. Вы хотите проверить нагрузку на стейджинге, но данные с прода брать нельзя – их нужно сгенерить. Тут начинаются проблемы.

    Размножить один и тот же джейсон будет неправильным, потому что все они дадут одинаковое значение индекса. В итоге индекс будет “перекошен”: миллион записей попадут в один блок, а остальные сто тысяч будут равномерны. В реальности так не бывает.

    Второй вопрос – как генерить. Можно взять язык, на котором вы пишете, и наколбасить случайные словари в CSV. Потом сжать в gzip, перетащить на сервер с базой, распаковать и вставить через COPY IN. Но придется писать код и воевать с передачей файлов по SCP/SSH.

    Я склоняюсь к вот такому костылику.

    Берем с прода любой JSON, записываем в локальный файл с красивым форматированием. Например:

    {
        "meta": {
            "eyes": "brown"
        },
        "attrs": {
            "email": "petr@test.com",
            "name": "Petr Ivanov"
        },
        "roles": [
            "user",
            "admin"
        ]
    }
    

    Здесь он маленький для экономии места, а на проде может быть пять экранов. После этого пропускам файл через серию регулярок:

    cat sample.json | sed \
         -e "s/\"/'/g" -e 's/: /, /g' \
         -e 's/{/jsonb_build_object(/g' \
         -e 's/}/\)/g' \
         -e 's/\[/jsonb_build_array(/g' \
         -e 's/\]/)/g'
    

    Получается SQL-код, который строит тот же самый JSON:

    jsonb_build_object(
        'meta', jsonb_build_object(
            'eyes', 'brown'
        ),
        'attrs', jsonb_build_object(
            'email', 'petr@test.com',
            'name', 'Petr Ivanov'
        ),
        'roles', jsonb_build_array(
            'user',
            'admin'
        )
    )
    

    Наберите в консоли SELECT и вставьте эту колбасу. База выплюнет в точности тот JSON, который был в файле.

    Если форматировать JSON лень, добавьте в пайп утилиту jq — по умолчанию она просто форматирует документ.

    Это был только один джейсон. Теперь размножим его с помощью select ... from generate_series...

    select jsonb_build_object(
        'meta', jsonb_build_object(
            'eyes', 'brown'
        ),
        'attrs', jsonb_build_object(
            'email', 'petr@test.com',
            'name', 'Petr Ivanov'
        ),
        'roles', jsonb_build_array(
            'user',
            'admin'
        )
    ) as document
    from
        generate_series(1, 5) as x;
    

    Выборка вернет столько документов, сколько чисел в диапазоне generate_series. Но это один и тот же документ, что не подходит. Пройдитесь по значимым полям документа и замените статичные строки на форматирование, например так (переменная x ссылается на текущее значение generate_series):

    select jsonb_build_object(
        'meta', jsonb_build_object(
            'eyes', format('color-%s', x)
        ),
        'attrs', jsonb_build_object(
            'email', format('user-%s@test.com', x),
            'name', format('Test Name %s', x)
        ),
        'roles', jsonb_build_array(
            'user',
            'admin'
        )
    ) as document
    from
        generate_series(1, 5) as x;
    

    Новая выборка станет такой:

                                                         document
    -------------------------------------------------------------------------------------------------------------------------
     {"meta": {"eyes": "color-1"}, "attrs": {"name": "Test Name 1", "email": "user-1@test.com"}, "roles": ["user", "admin"]}
     {"meta": {"eyes": "color-2"}, "attrs": {"name": "Test Name 2", "email": "user-2@test.com"}, "roles": ["user", "admin"]}
     {"meta": {"eyes": "color-3"}, "attrs": {"name": "Test Name 3", "email": "user-3@test.com"}, "roles": ["user", "admin"]}
     {"meta": {"eyes": "color-4"}, "attrs": {"name": "Test Name 4", "email": "user-4@test.com"}, "roles": ["user", "admin"]}
     {"meta": {"eyes": "color-5"}, "attrs": {"name": "Test Name 5", "email": "user-5@test.com"}, "roles": ["user", "admin"]}
    (5 rows)
    

    Вставим выборку в таблицу документов:

    create table documents(id uuid, document jsonb)
    

    Для этого допишем в запрос шапку INSERT:

    insert into documents (id, document)
    select
        gen_random_uuid() as id,
        jsonb_build_object(
            '__generated__', true,
            'meta', jsonb_build_object(
                'eyes', format('color-%s', x)
            ),
            'attrs', jsonb_build_object(
                'email', format('user-%s@test.com', x),
                'name', format('Test Name %s', x)
            ),
            'roles', jsonb_build_array(
                'user',
                'admin'
            )
        ) as document
    from
        generate_series(1, 500) as x
    returning
        id;
    

    Обратите внимание на поле __generated__: я добавил его, чтобы отличить обычный документ от сгенерированного.

    Запустите запрос, и в таблице окажется миллион случайных документов. Вставка может занять до пары минут, потому что JSONb — дорогое удовольствие.

    Если что-то пошло не так, удалите сгенерированные документы запросом:

    delete from documents
    where document -> '__generated__' = 'true'::jsonb;
    

    Удобство в том, что не нужны питоны-джавы, все делается силами SQL. Не придется генерировать CSV и перетаскивать на сервер. Просто выполнили запрос — и пошли дальше.

    Обязательно сохраните скрипт в недрах проекта. Он понадобится если не завтра, то через месяц, а если не вам, то коллеге. И вы такой раз — как Джонни Старк на картинке.

  • Помешательство

    Может быть, писал про это раньше, лень искать.

    Допустим, у нас современное веб-приложение: на сервере только REST API, а рендер силами JavaScript. Одна из апишек отдает сведения о покупках: число, сумму и дату последней покупки. Что-то вроде такого:

    {
      "total_orders": 7,
      "total_sum": "523626",
      "last_order_date": "2023-12-23T12:23:55Z"
    }
    

    (сумма в копейках, если что)

    Ожидается, что на клиенте мы покажем эту информацию так:

    Вы совершили семь покупок на сумму 5.236 рублей 26 копеек. Последний раз вы покупали 23 декабря, 20 дней назад.

    Чтобы отрендерить этот блок, нам понадобятся:

    • библиотека “число прописью”, чтобы 7 стало “семь”;
    • склонение с учетом числительных: 1 покупка, 3 покупки, 5 покупок;
    • форматирование суммы;
    • форматирование дат;
    • вычитание дат (20 дней назад);
    • возможно, мультиязычные шаблоны, если в приложении несколько языков.

    И думаю: есть же люди, которые всерьез делают это на JavaScript(!) в браузере(!!). Подключают тонны библиотек из npm, пишут экраны кода, компилируют мегабайтные бандлы. Запускают всю эту машинерию, кодят месяц и в итоге получают что-то похожее на результат. Который, конечно, работает только в Хроме на 4К-мониторе. На мобиле обрежется, в Фаерфоксе разъедется, в Сафари будет белый экран.

    Что движет этими людьми, интересно? И кто за них отвечает? Что за извращенное удовольствие: из всех вариантов выбрать самый хрупкий и тяжелый?

    Похоже на массовое помешательство.

  • Прощай, Goo.gl!

    Новость о том, что Гугл отключает сокращалку goo.gl, вызвала вьетнамские флешбеки.

    Пятнадцать лет назад я был ее активным пользователем. Я тогда жил в Чите и работал в славной компании “Читаэнергосбыт”. Параллельно я пытался сделать какой-нибудь стартап. А поскольку ничего придумать не мог, все поделки сводились к перекладыванию данных: из RSS в Твиттер, из одной соцсети в другую и так далее.

    В те времена у Твиттера не было сокращалки урлов. Вставил в сообщение ссылку — и прощай 40-50 символов. Сегодня это звучит дико, но тем не менее. Это был золотой век всяких tr.im, bit.ly и goo.gl — пока у каждой соцести не появились внутренние сокращалки.

    Пока я тестировал свои поделки, сократил около 15 тысяч урлов. Я даже написал библиотеку-клиент, и это был, наверное, мой первый опенсорс.

    Так вот, возвращаясь к закрытию сокращалки. Если бы я услышал эту новость хотя бы год назад, я бы вознегодовал и написал гневный пост: как так, денег и поддержки не просит, зачем закрывать? А сегодня мне безразлично.

    Во-первых, технически забрать данные об урлах проще простого. Не нужные никакие экспорты, достаточно баш-скрипта с курлом и флажком “don’t follow redirects”. Если у вас на сайте есть гугловые ссылки, заменить их нормальными — дело часа. Это технический аспект.

    Второй аспект — моральный. Сокращалки урлов устарели и считаются моветоном. Ими пользуются мошенники, СЕО-дрочеры и всякий озабоченный люд, которым важно, сколько раз нажали ссылку, вместо того, что было за ней. Если я вижу сокращенную ссылку, я никогда не нажму на нее, и советую вам то же самое.

    У сокращалок урлов был короткий период расцвета. Тогда еще не знали последствий, и сокращать урлы считалось крутым и молодежным. Были плагины для форумов и вордпрессов, которые сокращали все ссылки и подкачивали в админку стату переходов. Но все это в прошлом: у крупных игроков свои методы отслеживания ссылок, а мелким игрокам пользы от сокращалок нет.

    Третий аспект касается денег. Обязательно найдется тот, кто скажет: у Гугла денег куры не клюют, пусть поддерживают. Дело в том, что это противоречит миссии Гугла. Его цель — зарабатывать деньги. Это ясно уже лет десять, и почему сокращалка урлов, не приносящая денег, должна быть исключением? Она не приносит денег, поэтому ее нужно закрыть.

    Ситуация, когда какой-нибудь менеждер толкает речь на совете директоров о том, что мы должны поддерживать пользователей, потому что обещали им… и все такие: да, что же с нами стало, давайте оставим, только бы не сделать пользователям плохо… Представили картину? Так не бывает. Это возможно в фильме, но не в реальности.

    На эту тему советую почитать “Цель 2” Голдрата, причем не обязательно целиком, а хотя бы первую главу. Там как раз заседание директоров, и акулы рвут на части благие намерения. Почему — хорошо описано в диалоге с одной из акул во второй главе.

    Так что все своим чередом. Конфето-букетные отношения между пользователями и Гуглом закончились, остался один расчет. Гугл закрыл еще один сервис. Эпоха ушла, жизнь продолжается.

  • Ввод денег

    Интересно, бывают ли безглючные виджеты для ввода денег? Например, чтобы ввести тысячу сорок три рубля и тринадцать копеек — при этом так, чтобы не помянуть разработчика и его родню.

    По умолчанию в поле стоит ноль, и запросто бывает так, что курсор падает перед ним. В результате цифра умножается на десять. Что-то вроде такого:

    |0
    123|0
    

    Ни один виджет не работает со вставкой. Разработчик думает, что клиент сел — и такой ввел шесть цифр по памяти. На практике люди копируют цифры изо всяких экселей и платежек. Везде беда с десятичным разделителем, пробелами и позицией курсора.

    Зачем эти потуги, если результат все равно бажный?

    Интересное решение я видел у Пейпала. У них ввод суммы сделан как в старых терминалах. Нужно ввести сумму с точностью до цента, при этом цифры наползают справа налево. Постарался изобразить это табличкой:

    state input result
    0.00 1 0.01
    0.01 2 0.12
    0.12 3 1.23
    1.23 4 12.34

    Все жестко, никаких вариантов. Не уверен, что такой ввод подойдет нам, потому что у нас нет таких терминалов. Но взять на заметку стоит: меньше вариативности — больше надежности.

    PS: не привожу скришноты, потому что не вижу смысла. Любой банк, любое приложение. Виджеты денег не работают нигде.

  • И ещё об AWS SDK

    Последняя заметка об AWS SDK и все — закрываю тему, чтобы не утомлять.

    Почему я взъелся на этот SDK? Потому что в мире Кложи это своего рода проклятье. Нужно работать с сервисами Амазона и казалось бы — бери Джавный SDK и пиши обертку. Но библиотеки Амазона ужасны: нужно 25 пакетов ради HTTP-запроса, а классы написаны по отвратительному паттерну. Вдобавок это добро не компилируется Граалем — а у нас все на нем. В результате у нас самописные клиенты к S3, Dynamo, CloudWatch и десятку других сервисов.

    Меня это совсем не радует, потому что клиенты реализованы частично. Если нужна новая апишка, то открывай доку и пиши код. Самая жесть с сигнатурами. За короткое время я нашел два бага в библиотеке aws-sign, которая подписывает запрос. Отлаживать сигнатуры — такая грусть и боль, что и не хочется вспоминать.

    Узнав про SDK 2.0, я подумал, что пора перевести наш зоопарк на официальные библиотеки AWS. Пусть их поддерживают другие люди, а нам не придется кувыркаться с сигнатурами и прочим. Быстрый гуглеж показал, что SDK 2.0 дружит с Граалем, и я засел.

    Написал обертку, компилирую — не работает. Полез в интернет и выяснилось, что… даже руки опускаются от отчаяния. Релиз, который поддерживает GraalVM и компиляцию native-image, был год назад. За это время код поменяли, а нового релиза с Граалем не делали.

    Может быть, со стороны это звучит непоятно, но я поражен. Либо ты поддерживаешь GraalVM, либо нет. Он накладывает ограничения на Джава-код, поэтому важно принять решение и следовать ему. А у ребят из Амазона получились релизы Шредингера: этот поддерживает, тот нет, а следующий, возможно, будет снова поддерживать.

    Технически это лечится дополнительным шагом в CI, где текущая ветка компилируется Граалем, и если что-то не так — изменения не принимаются. Новый шаг добавляется в CI за пару часов без преувеличений. И только после этого можно писать в readme: да, мы поддерживаем Грааль. А не так — один раз получилось, значит, получится всегда.

    Мысль о стажерах, которых сажают писать SDK, пока нет другой работы, крепнет во мне все сильнее.

  • SDK, работа над ошибками

    Давайте поможем инженерам из Amazon с их SDK 2.0. Разберем наиболее серьезную ошибку – частичную инициализацию объекта.

    В прошлой заметке я упоминал, как создаются объекты в SDK. Если коротко, у классов скрыты конструкторы, и нужно пользоваться билдером. Получается что-то вроде такого:

    GetObjectRequest request = GetObjectRequest.builder()
      .bucket("acme-releases")
      .key("path/to/file.txt")
      .ifEtagMatches("....")
      .ifModifiedSince("...")
      .build()
    

    Билдер не знает, какие из параметров обязательны, а какие нет. В примере выше код работает. Если убрать вызов .bucket или .key, все скомпилируется, но при запуске получим:

    Execution error (IllegalArgumentException)
    at ....xml.internal.marshall.SimpleTypePathMarshaller
    
    Parameter 'Bucket' must not be null
    

    Обратите внимание, что ошибка приехала из какого-то XML-маршаллера, хотя никакого XML и тем более маршаллизации здесь нет. Тело пустое, и просто составляется URL.

    Подчеркну: программистам из Амазона вполне ОК, что объект инициирован частично. Спрашивается, что можно сделать с объектом GetObjectRequest, если у него не заполнен бакет? Ничего. Зачем тогда позволять такую ситуацию?

    Как они вообще представляют работу со своим SDK? Пользователь садится и перебором проверяет, какие поля нужны, а какие нет? Ладно я знаю, что бакет и ключ необходимы, но ведь кто-то не знает. И узнает он только когда бахнет прод.

    Проблема решается просто. Все поля объекта делятся на обязательные и нет – по аналогии с аргументами args и kwargs в Питоне. Обязательные поля потому так и называются, что без них невозможно дернуть конструктор или порождающий статичный метод. В нашем случае обязательны бакет и ключ. С ними код становится таким:

    GetObjectRequest request = new GetObjectRequest(
      "acme-releases", "path/to/file"
    ).withEtag("...")
      .withModifiedSince("...")
    

    либо то же самое с билдером:

    GetObjectRequest request = GetObjectRequest.builder(
      "acme-releases", "path/to/file")
    .etag("...")
      .modifiedSince("...")
      .build()
    

    То есть хоть разбейся в лепешку, но обязательные параметры передай.

    Ну? Что мешало так сделать? Здесь даже паттерны сохранены, чтобы не пострадало чувство прекрасного.

    Заметим, что я не говорю отсебятину: все это сказано в книге Effective Java авторства Джошуа Блоха. Он так и пишет: используйте неизменяемые объекты, не допускайте частичной инициализации, требуйте обязательные поля сразу – не надейтесь, что кто-то заполнит из позже. Кумир джавистов говорит, как делать правильно. Почему в Амазоне решили, что сами с усами?

    Впрочем, пока я писал это, подумал – может, все гораздо проще? Может быть, за SDK сажают мидлов и стажеров, пока они без задач? Скажем, наняли стажера, а у тимлида релиз, погружать человека некогда, поэтому его сажают за SDK. Вполне похоже на правду.

    У нас так было в Датаарте: пока человек без работы, его сажали за всякий внутренний хлам. Форму заказа пиццы, аукцион парковочных мест, каталог сотрудников. Все это было крайне низкого качества, потому что шло через десятки джунов и мидлов без какого-либо контроля качества.

    Может и в Амазоне такой же порядок? Кто знает, расскажите. Потому что чем иначе объяснить такое качество SDK – я не знаю.

Страница 5 из 84