Natural Language Processing (NLP)
INGA Technologies создана для решения прикладных NLP-задач, формулируемых существующими клиентами из сферы Интернет-медиа. Компания проинвестирована авторитетным венчурным фондом из Кремниевой Долины GVA Capital.
Возможные задачи:
- Экстрактивная суммаризация текста;
- Абстрактная суммаризация текста;
- Динамическая кластеризация текстов (например, новостного потока);
- Классификация текстов;
- Детектор тональности (pos/neg);
- Детектор adult/spam/rage/obscene;
- Поиск ключевых слов в тексте;
- Data extraction;
- Поиск заголовков в тексте.
Вакансия Senior Devops engineer:
Обязанности:
Коммуникация Организация средств коммуникаций; Ведение переговоров с подрядными организациями, как в части обслуживания, так и в части взаимодействия с поддержкой; Фасилитация регулярных митапов;
Интеграция Конфигурация и мониторинг инфраструктурных решений; · Конфигурация и мониторинг технологических платформ; Конфигурация и мониторинг средств доставки изменений; Конфигурация систем мониторинга и аварийного оповещения; Проведение исследований с целью поиска оптимальной архитектуры; · Проведение профилактических работ;
Управление знаниями Разработка соглашения о моделировании; Разработка стандартов и политик ведение разработки и управления изменениями; Разработка соглашений об уровне сервисного обслуживания; Описание архитектуры потока данных и архитектуры развертывания; Моделирование базы данных знаний;
Требования:
- Сильные коммуникационные навыки (опыт фасилитации meetup’ов и проведения сложных переговоров)
- Опыт конфигурирования и модерирования средств связи (настройка средств аварийного оповещения Slack, Telegram, организация доступа к базам знаний)
- Хорошее знание форматов данных (Protobuf, Pickle), понимание процессов сериализации и десериализации форматов
-
Опыт развертывания и конфигурирования брокера сообщений (Kafka, RabbitMQ), конфигурирование интерфейсов взаимодействия с сервисами, а так же опыт использования очередей в качестве распределенного хранилища данных.
- Опыт интеграции и конфигурации облачных сервисов, хорошее понимание serverless архитектуры (Google, Amazon)
- Хорошее знание контейнерных технологий (Docker), опыт оркестрирования сложных распределенных контейнеризированных систем (Kubernetes)
- Уверенное понимание UNIX подобных операционных систем, хорошее знание bash команд
- Опыт развертывания и администрирования систем контроля версий Git, опыт организации непрерывной доставки изменений CI/CD (автоматизированное тестирования, контроль стандартов, сборка, развертывание) -Опыт профилирования нагрузки распределенных систем, проведения нагрузочных испытаний. Предпочтительным будет считаться опыт использования систем предупреждения аварии. -Хорошее знание средств мониторинга, опыт настройки сбора и отображения метрик (Grafana, Influx).
- Опыт конфигурирование средств агрегации журнала логов (GrayLog) -Уверенное знание высокоуровневых языков программирования (Python) и язык запросов SQL. Предпочтительным будет считаться опыт написание DataProxy -Понимание парадигм ООП и шаблонов программирования -Хорошее знание современных средств хранение данных, понимание CAP теоремы.
- Опыт конфигурации индексов баз данных. -Знание нотаций моделирование архитектурных схем. Опыт написание стандартов, политик. Опыт модерирования баз данных знаний
(Если кто будет искать в поиске!)
Кандидата рассматриваются только с выполненным заданием:
От соискателя требуется сформулировать видение целевой архитектуру пайплайна реализующую непрерывное обучение серии моделей. Порядок обучения моделей строго определен, в некоторых моделях возможно параллельное обучение. В архитектуре должны быть предусмотрены блоки реализующие оценку качества потока и исполнение аварийных протоколов. Для проектируемой архитектуры не наложены никакие ограничения по использованию компонентов известных вендоров (on-premise, cloud). Архитектура должна быть представлена в форме схемы (pdf или растровые форматы изображений) оформленной в любой известной соискателю нотации, а также сопроводительного документа с пояснениями к схеме. Пайплайн предполагает забор данных из внешней реляционной базы данных.
Целевая архитектура должна обладать высокими значениями следующих характеристик:
- Минимальные потери данных
- Высокая гибкость разработки и конфигурирования
- Хорошая масштабируемость
- Маленькие задержки