Skip Navigation
pythontalk_ru
Наука и Технологии вчера
Telegram
🏴‍☠️ Перевод текстов: бесплатно, сердито и без API-ключей
🏴‍☠️ Перевод текстов: бесплатно, сердито и без API-ключей

Если вы хоть раз пытались прикрутить перевод текста к своему пет-проекту или парсеру, то знаете эту боль. Официальный Google Cloud Translation требует привязку карты и квоты, DeepL API — прекрасен, но дорог (и сложен в оплате из РФ), а писать свой скрапер для веб-морды переводчика — это гарантированный ад с генерацией токенов (tk), подписью запросов и постоянными отвалами верстки.
Но есть translators — библиотека, которая делает эту работу за вас.
Это агрегатор, который (по сути, методом реверс-инжиниринга) стучится в веб-интерфейсы более 30 переводческих сервисов.

Что под капотом:

1️⃣ Ассортимент. Кроме банальных Google/Bing/Yandex, там есть DeepL (лучшее качество для европейских языков), Baidu/Alibaba (для китайщины) и даже специфические штуки типа VolcEngine.

2️⃣ HTML-friendly. Функция translate_html умеет переводить контент, не ломая структуру тегов.

3️⃣ Умный обход. Есть поддержка разных HTTP-клиентов: requests, httpx, niquests и даже cloudscraper. Если один метод блокируют по фингерпринту, можно переключиться на другой прямо в аргументах.

4️⃣ JS-магия. Библиотека сама выполняет нужный JavaScript (через exejs) для генерации подписей запросов. Да, для этого в системе должен быть Node.js, но это малая плата за халяву.

🧑‍💻 Как это выглядит в коде:

import translators as ts

text = "Python is a language for rebels."

# Используем движок Alibaba
print(ts.translate_text(text, translator='alibaba', to_language='ru'))
# Вывод: Python - это язык для повстанцев.

# Или DeepL (если IP не в бане)
print(ts.translate_text(text, translator='deepl', to_language='ru'))


⚠️ Ложка дегтя (куда же без неё):
Это не решение для High-Load продакшена. Это скрапинг.
Вас будут банить по IP, если начнете долбить тысячи запросов в секунду (хотя в либе есть кэширование сессий preaccelerate).
API веб-интерфейсов могут меняться без предупреждения, и придется ждать обновления пакета.

Но для дата-аналитики, сбора датасетов, ботов или личных тулзов — хороший инструмент, который сэкономит кучу денег.

#годный_опенсорс
pythontalk_ru
Наука и Технологии 6 март
Telegram
Симулируем кожаных 👩‍👩‍👦


Симулируем кожаных 👩‍👩‍👦

У Microsoft есть интересный open-source проект — TinyTroupe. В чем суть? Большинство фреймворков заточены под assistance — помощь в решении задач. TinyTroupe заточен под симуляцию. Разница фундаментальная: ассистент должен быть эффективным, а симулятор — достоверным. Достоверный человек тупит, имеет предвзятость, помнит о завтраке и обладает характером.

Что внутри этого Python-зоопарка:
1. TinyPerson: У агента есть mental_faculty (когнитивные способности) и два вида памяти: EpisodicMemory (событийная цепочка) и SemanticMemory (база знаний и фактов).
2. Action Correction: Если LLM-агент внезапно «забывает» свою личность (например, веган начинает советовать стейк-хаус), система валидации TinyPersonValidator ловит это за руку, дает агенту по шапке и заставляет перегенерировать действие.
3. TinyWorld: Среда обитания. Здесь агенты взаимодействуют по правилам, которые вы описываете кодом. Можно задать даже социальную сеть с графами отношений.
4. TinyFactory: Генератор толпы. Если вам нужно 50 бразильских врачей, любящих тяжелый металл и экологию, для теста вашего нового приложения — фабрика их нашинкует по демографическим вводным.

Зачем это все?
Синтетические данные: Вместо того чтобы мучить реальных юзеров или покупать сомнительные датасеты, вы прогоняете проект через фокус-группу из 100 агентов с разными характерами.
Тестирование ПО: Можно заставить агента «пользоваться» вашим чат-ботом или поисковиком и смотреть, где он сломает логику своими человеческими ожиданиями.
Маркетинг: Оценка рекламы на симулированной аудитории до того, как вы сольете весь бюджет.

Внутри — типичный современный Python-стек: llama-index для RAG, chevron для шаблонов промптов и много-много JSON-спецификаций. Главный минус — по умолчанию все заточено под OpenAI.

Ну и кроме всего прочего, это доказательство, что мы живем в матрице 🌝

#годный_опенсорс

Управлять можно с клавиатуры

Работает в лентах: голосование, переход между постами и разворот текста.

W
S
A
D
F
Топ авторов за месяц
Свежие комментарии