Что такое потоковая передача данных в режиме реального времени?

Потоковая передача данных в режиме реального времени включает сбор и получение последовательности данных из различных источников. Кроме того, такие данные также оперативно обрабатываются, что дает возможность извлекать значение и аналитические сведения.

Примеры потоковых данных: файлы журналов, генерируемые пользователями мобильных или интернет-приложений, покупки в интернет-магазинах, действия игроков в играх, информация из социальных сетей, финансовых торговых площадок и геопространственных сервисов, а также телеметрические данные, полученные от подключенных устройств или оборудования в центрах обработки данных.

Потоковая передача данных в режиме реального времени дает возможность оперативно анализировать и обрабатывать данные вместо того, чтобы ждать ответов в течение нескольких часов, дней или даже недель.

Подробнее о потоковых данных»

Из чего состоит передача данных в режиме реального времени?

Источник. Сотни и тысячи устройств или приложений, которые производят большие объемы непрерывных данных с высокой скоростью. Примерами могут служить мобильные устройства, веб-приложения (история посещений), журналы приложений, датчики Интренета вещей, смарт-устройства и игровые приложения. 

Получение потоковых данных. Простая интеграция с более чем 15 сервисами AWS (Amazon API Gateway, AWS IoT Core, Amazon Cloudwatch и другими) дает возможность надежно и безопасно осуществлять непрерывный сбор данных, поступающих от тысяч устройств.

Хранилище потоковых данных. Выберите решение, отвечающее вашим потребностям в хранении данных с учетом требований к масштабированию, задержкам и обработке, например Потоки данных Amazon Kinesis, Данные Amazon Kinesis Firehose и Управляемая потоковая передача Amazon для Apache Kafka (Amazon MSK).

Обработка потоковых данных. Выберите один из множества сервисов, от решений для преобразования и непрерывной передачи данных в несколько щелчков мышью в такие места, как Данные Amazon Kinesis Firehose, до работающих в режиме реального времени мощных специализированных приложений и интеграций машинного обучения с применением таких сервисов, как Управляемый сервис Amazon для Apache Flink и AWS Lambda.

Место назначения. Передавайте потоковые данные в ряд полностью интегрированных озер данных, хранилищ данных и аналитических сервисов для дальнейшего анализа или длительного хранения, таких как Amazon S3, Amazon Redshift, Сервис Amazon OpenSearch и Amazon EMR.

Каковы примеры использования потоковой передачи данных в режиме реального времени?

Перемещение данных в режиме реального времени

Потоковая передача данных с сотен тысяч устройств и выполнение ETL-преобразований при больших объемах непрерывных и высокоскоростных данных в режиме реального времени дают пользователям возможность осуществлять анализ данных сразу после их получения, а затем длительное время хранить их в озере данных, хранилище данных или базе данных для дальнейшего анализа.

Узнайте, как WalkMe преодолевает проблемы секвенирования при передаче данных в озеро данных

Узнайте, как John Deere выполняет потоковую передачу ETL в озеро данных в режиме реального времени

Аналитика в режиме реального времени

Анализируйте данные сразу после их получения и принимайте решения в масштабах организации в режиме реального времени, чтобы реализовать открывающиеся возможности, улучшить качество обслуживания клиентов, предотвратить сбои в работе сети или оперативно обновлять критически важные показатели деятельности.

Журналы. Собирайте, обрабатывайте и анализируйте журналы приложений в режиме реального времени. 

Ознакомьтесь с возможностями анализа поведения пользователей в режиме реального времени

Узнайте, как анализировать и визуализировать сетевой трафик VPC

Узнайте, как управлять централизованными журналами сервера Microsoft Exchange

Подробнее об аналитике журналов »

Обновления в режиме реального времени. Привлекайте потребителей, геймеров, финансовых трейдеров и других пользователей, обеспечивая оперативное обновление важнейших показателей для принятия решений, рекомендаций и данных о взаимодействии с клиентами. 

Узнайте, как порадовать геймеров за счет аналитики игр в режиме реального времени

Узнайте, как сообщать актуальные персонализированные новости в режиме реального времени

История посещений. Получите представление о производительности вашего интернет-контента и взаимодействии пользователей с вашими приложениями и веб-сайтами в режиме реального времени, в том числе об их поведении, затраченном времени, популярном контенте и других показателях. 

Узнайте, как компания Hearst создала решение для анализа истории посещений, с помощью которого можно передавать и обрабатывать 30 ТБ данных, ежедневно поступающих с более чем 300 веб‑сайтов по всему миру

Интернет вещей. Подключайтесь к сотням тысяч устройств Интернета вещей, собирайте, обрабатывайте и анализируйте потоковые данные в режиме реального времени. 

Узнайте, как компания John Deere в режиме реального времени собирает данные с десятков тысяч сельскохозяйственных машин с целью оптимизации производства продуктов питания

Потоковая обработка событий

Фиксируйте события и оперативно реагируйте на них по мере возникновения в различных приложениях. Наиболее распространенные варианты использования – взаимодействие между сотнями изолированных микросервисов и ведение системы регистрации за счет сбора данных об изменениях. 

Взаимодействие между изолированными микросервисами. При срабатывании любого микросервиса событие может отправляться в поток данных в режиме реального времени, и другие микросервисы могут «наблюдать» за потоком, чтобы определить, произошло ли какое-либо событие, инициирующее требуемое действие. 

Узнайте, как Lyft обменивается данными между сотнями микросервисов в режиме реального времени

Сбор данных об изменениях. Все изменения данных в нескольких приложениях и базах данных могут в режиме реального времени передаваться в центральную систему регистрации. 

Узнайте, как загрузить собранные данные об изменениях из реляционных баз данных

Узнайте, как выполнять потоковую передачу собранных данных об изменениях в режиме реального времени

Какие сервисы потоковой передачи данных доступны на базе AWS?

AWS предоставляет несколько вариантов работы с потоковыми данными в реальном времени. 

  • Потоки данных Amazon Kinesis – это масштабируемый и надежный сервис для потоковой передачи данных в реальном времени, который может ежесекундно обрабатывать гигабайты данных, поступающих из сотен тысяч источников.
  • Данные Amazon Kinesis Firehose дают возможность всего в несколько кликов захватывать, преобразовывать и загружать потоки данных в хранилища данных AWS для анализа в режиме, близком к реальному времени, с помощью существующих инструментов бизнес-аналитики.
  • Управляемый сервис Amazon для Apache Flink преобразует и анализирует потоковые данные в реальном времени с помощью Apache Flink, платформы с открытым исходным кодом и механизма для обработки потоков данных.
  • Управляемая потоковая передача Amazon для Apache Kafka – это полностью управляемый сервис, который упрощает создание и запуск приложений, использующих Apache Kafka для обработки потоковых данных.

Создайте аккаунт и начните потоковую передачу данных в реальном времени на базе AWS уже сегодня.

AWS: дальнейшие шаги

Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS.

Регистрация 
Начать разработку в консоли

Начните разработку в Консоли управления AWS.

Вход