Natural Language Processing (NLP)


INGA Technologies создана для решения прикладных NLP-задач, формулируемых существующими клиентами из сферы Интернет-медиа. Компания проинвестирована авторитетным венчурным фондом из Кремниевой Долины GVA Capital.


Возможные задачи:

  • Экстрактивная суммаризация текста;
  • Абстрактная суммаризация текста;
  • Динамическая кластеризация текстов (например, новостного потока);
  • Классификация текстов;
  • Детектор тональности (pos/neg);
  • Детектор adult/spam/rage/obscene;
  • Поиск ключевых слов в тексте;
  • Data extraction;
  • Поиск заголовков в тексте.


Вакансия Senior Devops engineer:

Обязанности:

Коммуникация Организация средств коммуникаций; Ведение переговоров с подрядными организациями, как в части обслуживания, так и в части взаимодействия с поддержкой; Фасилитация регулярных митапов;

Интеграция Конфигурация и мониторинг инфраструктурных решений; · Конфигурация и мониторинг технологических платформ; Конфигурация и мониторинг средств доставки изменений; Конфигурация систем мониторинга и аварийного оповещения; Проведение исследований с целью поиска оптимальной архитектуры; · Проведение профилактических работ;

Управление знаниями Разработка соглашения о моделировании; Разработка стандартов и политик ведение разработки и управления изменениями; Разработка соглашений об уровне сервисного обслуживания; Описание архитектуры потока данных и архитектуры развертывания; Моделирование базы данных знаний;

Требования:

  • Сильные коммуникационные навыки (опыт фасилитации meetup’ов и проведения сложных переговоров)
  • Опыт конфигурирования и модерирования средств связи (настройка средств аварийного оповещения Slack, Telegram, организация доступа к базам знаний)
  • Хорошее знание форматов данных (Protobuf, Pickle), понимание процессов сериализации и десериализации форматов
  • Опыт развертывания и конфигурирования брокера сообщений (Kafka, RabbitMQ), конфигурирование интерфейсов взаимодействия с сервисами, а так же опыт использования очередей в качестве распределенного хранилища данных.

  • Опыт интеграции и конфигурации облачных сервисов, хорошее понимание serverless архитектуры (Google, Amazon)
  • Хорошее знание контейнерных технологий (Docker), опыт оркестрирования сложных распределенных контейнеризированных систем (Kubernetes)
  • Уверенное понимание UNIX подобных операционных систем, хорошее знание bash команд
  • Опыт развертывания и администрирования систем контроля версий Git, опыт организации непрерывной доставки изменений CI/CD (автоматизированное тестирования, контроль стандартов, сборка, развертывание) -Опыт профилирования нагрузки распределенных систем, проведения нагрузочных испытаний. Предпочтительным будет считаться опыт использования систем предупреждения аварии. -Хорошее знание средств мониторинга, опыт настройки сбора и отображения метрик (Grafana, Influx).
  • Опыт конфигурирование средств агрегации журнала логов (GrayLog) -Уверенное знание высокоуровневых языков программирования (Python) и язык запросов SQL. Предпочтительным будет считаться опыт написание DataProxy -Понимание парадигм ООП и шаблонов программирования -Хорошее знание современных средств хранение данных, понимание CAP теоремы.
  • Опыт конфигурации индексов баз данных. -Знание нотаций моделирование архитектурных схем. Опыт написание стандартов, политик. Опыт модерирования баз данных знаний


(Если кто будет искать в поиске!)

Кандидата рассматриваются только с выполненным заданием:

От соискателя требуется сформулировать видение целевой архитектуру пайплайна реализующую непрерывное обучение серии моделей. Порядок обучения моделей строго определен, в некоторых моделях возможно параллельное обучение. В архитектуре должны быть предусмотрены блоки реализующие оценку качества потока и исполнение аварийных протоколов. Для проектируемой архитектуры не наложены никакие ограничения по использованию компонентов известных вендоров (on-premise, cloud). Архитектура должна быть представлена в форме схемы (pdf или растровые форматы изображений) оформленной в любой известной соискателю нотации, а также сопроводительного документа с пояснениями к схеме. Пайплайн предполагает забор данных из внешней реляционной базы данных.

Целевая архитектура должна обладать высокими значениями следующих характеристик:

  • Минимальные потери данных
  • Высокая гибкость разработки и конфигурирования
  • Хорошая масштабируемость
  • Маленькие задержки