27.01.2023 13:14

Новости

Администратор

Автор:

Администратор

Необходимый контрольный список для эффективной демократизации данных

Чтобы стать управляемыми данными, компаниям нужна стратегия демократизации, в равной степени дисциплинированная и разнообразная. Сбор данных, выбор платформы и обучение сотрудников — только начало.


Автор: Мария и Алекс Королев, авторы CIO

 

Компании, по-настоящему ориентированные на данные, получают значительно лучшие бизнес-результаты, чем те, которые этого не делают. Согласно недавнему официальному документу IDC, результаты лидеров по многим бизнес-показателям в среднем в два с половиной раза лучше, чем других организаций. В частности, компании, которые лидировали в использовании данных и аналитики, в три раза увеличили доходы, почти в три раза чаще сообщали о сокращении сроков выхода на рынок новых продуктов и услуг и более чем в два раза чаще сообщали об улучшении удовлетворенности клиентов, увеличении прибыли и операционной эффективности.

 

Но чтобы извлечь максимальную пользу из данных и аналитики, компаниям необходимо внедрить культуру, основанную на данных, пронизывающую всю организацию, при которой каждое бизнес-подразделение получает полный доступ к необходимым ему данным в том виде, в котором они ему нужны.

 

Это называется демократизацией данных. Чтобы сделать это правильно, требуется продуманный сбор данных, тщательный выбор информационной платформы, которая обеспечивает целостный и безопасный доступ к данным, а также обучение и расширение прав и возможностей сотрудников, чтобы они ориентировались на данные в первую очередь. Также необходимо разобраться с рисками безопасности и соответствия требованиям.

 

Начало —  прочная база данных

 

Прежде чем выбрать платформу для обмена данными, организация должна понять, какие данные у нее уже есть, и очистить их от ошибок и дубликатов.

 

По словам Хуана Орландини, главного архитектора и инженера Insight Enterprises, большая часть подготовки данных для совместного использования — это упражнение по их нормализации.

 

Форматы данных и архитектура данных часто несовместимы, и данные могут быть даже неполными. «Внезапно вы пытаетесь передать эти данные кому-то, кто не занимается обработкой данных, и им очень легко сделать ошибочные или вводящие в заблуждение выводы из этих данных», - говорит он.

 

Организации часто обращаются к сторонней помощи в нормализации данных, потому что, если все сделано неправильно, у бизнеса могут остаться проблемы с качеством данных, и он не сможет использовать данные так, как предполагалось.

 

По мере того как все больше компаний используют облако и облачные разработки, нормализация данных становится все более сложной.

 

«Данные могут быть в базе данных NoSQL, графовой базе данных или в других типах баз данных, которые доступны в настоящее время, и обеспечение согласованности становится действительно сложной задачей», - говорит Орландини.

 

Выбор платформы

 

Во многих случаях только ИТ-отдел имеет доступ к данным и инструментам анализа данных в организациях, которые не практикуют демократизацию данных. Поэтому для того, чтобы сделать данные доступными для всех, требуются новые инструменты и технологии.

 

Конечно, большое значение имеет стоимость, говорит Орландини, а также решение о том, где разместить данные и обеспечить их доступность с финансовой точки зрения. Организация также может задаться вопросом, следует ли хранить данные локально из-за соображений безопасности или в общедоступном облаке. Но Кевин Янг, старший консультант по данным и аналитике консалтинговой компании SPR, говорит, что организации могут сначала обмениваться данными, создав озеро данных, подобное Amazon S3 или Google Cloud Storage. «Сотрудники всей организации могут добавлять свои данные в озеро для использования всеми подразделениями», - говорит Янг. Но без надлежащего ухода озеро данных может оказаться дезорганизованным и загроможденным непригодными для использования данными. По словам Орландини, большинство организаций в конечном итоге не получают озер данных. «У них есть болота данных», - говорит он.

 

Но озера данных — не единственный вариант создания централизованного хранилища данных.

 

Другой — с помощью фабрики данных (Data Fabric), архитектуры и набора сервисов передачи данных, которые обеспечивают унифицированное представление данных организации и позволяют осуществлять интеграцию из различных источников локально, в облаке и на периферийных устройствах.

 

Data Fabric позволяет объединять наборы данных без необходимости создания копий и может снизить вероятность разрозненности.

 

Существует множество поставщиков программного обеспечения для Data Fabric, таких как IBM Cloud Pak for Data и SAP Data Intelligence, которые были названы лидерами в отчете Forrester Enterprise Data Fabric за второй квартал 2022 года. Но при наличии множества доступных вариантов может быть трудно понять, какой из них выбрать.

 

Самое главное — анализировать и отслеживать данные, говорит Амареш Трипати, глобальный аналитик компании Genpact, предоставляющей профессиональные услуги.

 

«Существует множество платформ», - объясняет он. «Выберите любую платформу, которая вам подходит. Но она должна быть автоматизированной и видимой». Кроме того, данные должны быть легко доступны с платформы самообслуживания, которая упрощает отчетность по анализу данных даже для людей без технического опыта. «Это должно работать как портал, где люди могут видеть все данные, понимать, что они означают, каковы показатели и откуда они поступают», - говорит Трипати.

 

Идеального инструмента не существует, и часто приходится искать компромисс между тем, насколько хорошо инструмент выполняет сбор данных, каталогизацию данных и поддерживает качество данных. «Большинство организаций пытаются решить все три проблемы сразу», - добавляет Трипати. «Иногда вы переоцениваете один параметр и получаете не очень хорошие значения другого». Поэтому организация должна решить, что является наиболее важным. «Они должны знать, зачем они это делают, какой инструмент дает им наилучшую отдачу в этих трех измерениях, а затем принимать соответствующее решение».

 

Размышляя о том, как обмениваться данными, организация может также рассмотреть возможность внедрения сети данных (Data Mesh), которая использует противоположный подход. В то время как Data Fabric управляет несколькими источниками данных из единой виртуальной централизованной системы, Data Mesh — это форма корпоративной архитектуры данных, которая использует децентрализованный подход и создает несколько систем, специфичных для домена.

 

С помощью сети данных организации могут обеспечить надлежащую обработку данных, передавая их в руки тех, кто лучше всего в них разбирается, говорит Крис Маклеллан, директор по операциям Data Collaboration Alliance, глобальной некоммерческой организации, которая помогает людям и компаниям получить полный контроль над своими данными. Это может быть человек, например, финансовый директор, или группа людей, которые выступают в качестве распорядителей данных.

 

Внедрение архитектуры Data Mesh позволяет организации передавать конкретные наборы данных в руки профильных экспертов. «Эти люди ближе к правилам, клиентам и конечным пользователям», - говорит Маклеллан. «Они ближе ко всему, что касается этой конкретной области информации».

 

Data Mesh не привязана к каким-либо конкретным инструментам, поэтому отдельные команды могут выбирать те, которые наилучшим образом соответствуют их потребностям, и нет проблем в том, что все должно проходить через центральную группу обработки данных.

 

«Вы наблюдаете децентрализацию не только ИТ или доставки приложений, но и управления данными», - говорит Маклеллан. «И это хорошо, потому что маркетологи знают законы о защите прав потребителей лучше, чем ИТ-команда, а финансисты лучше знают финансовые требования».

 

Несмотря на то, что существует множество поставщиков Data Mesh, Forrester предупреждает, что это все еще блестящий новый объект, и у него есть свои проблемы, включая конфликты в том, как он определяется, технологии, которые он использует, и его ценность.

 

Обучение и управление изменениями

 

Как только будет создана архитектура демократизации данных, сотрудникам необходимо понять, как работать с новыми процессами обработки данных. Людям можно предоставить правильные данные, но даже если они администраторы или бухгалтеры, они не обязательно поймут, что с ними делать, говорит Орландини из Insight. Доступа к данным самого по себе недостаточно для того, чтобы сделать организацию управляемой данными. «Нужно немного потренироваться», - говорит он. «Если вы не сделаете это должным образом, у вас в лучшем случае будет смешанный успех, или это может быть провал».

 

Некоторые организации запустили собственные внутренние программы обучения, чтобы сотрудники понимали, как интерпретировать данные и правильно с ними обращаться.

 

Genpact, например, в прошлом году представила так называемую инициативу DataBridge, направленную на повышение информационной грамотности во всей организации.

 

«Наше намерение состояло не в том, чтобы сделать 100 000 человек гражданскими специалистами по данным», - говорит Трипати. «Мы обеспечиваем осведомленность в контексте того, как они выполняют свою работу». Например, сотруднику, занимающемуся анализом претензий, не обязательно знать все об обнаружении аномалий — ему нужно понять, что для него означает обнаружение аномалий. «У вас могут быть или не быть все необходимые навыки, чтобы самостоятельно просматривать данные, но вы должны быть в состоянии задать вопрос и обратиться за помощью, а умение правильно задать этот вопрос — это аспект работы с данными», - добавляет он.

 

Создание основы для обеспечения безопасности и соответствия требованиям

 

Надлежащее управление данными должно быть внедрено с самого начала, чтобы сохранить целостность данных и избежать дорогостоящих штрафных санкций.

 

По словам Орландини из Insight, в первоначальном разговоре должны участвовать не только ИТ-руководители, но и команды по безопасности и соблюдению нормативных требований. «Это большая проблема, и многие организации борются с этим», - говорит он, добавляя, что это обязательное условие, чтобы руководство компании точно понимало, чем они предлагают поделиться, и следило за тем, чтобы это предлагалось нужным людям.

 

«Мы живем в строго регулируемом мире, где мы должны быть очень осторожны, особенно в таких отраслях, как здравоохранение и финансы, где существуют законы, которые имеют серьезные последствия, если вы позволите не тому человеку получить доступ к неправильным данным», - говорит он.

 

Существуют также инструменты, которые помогают организациям маскировать и запутывать данные, чтобы избежать раскрытия личной информации. «Вы можете начать получать информацию, не раскрывая данные PII, записи HIPAA или какие-либо из тех нормативных требований, которые существуют», - продолжает он. «Есть также инструменты с элементами управления доступом на основе атрибутов, где вы фактически помечаете данные очень специфическими типами атрибутов, и тогда у вас есть доступ к данным только с правильным типом атрибутов».

 

Таким образом, данные контролируются автоматически, и находятся в общедоступном облаке или гибридной среде или даже в частных средах со строгим контролем соответствия, который может быть установлен.

 

Долгосрочные преимущества

 

Демократизация данных может не только помочь предприятию ускорить процесс обработки данных, но и дать людям возможность находить новые способы решения проблем благодаря лучшему пониманию того, как анализировать данные и работать с ними.

 

Gartner утверждает, что, внедряя демократизацию данных, организации могут решить проблему нехватки ресурсов, устранить узкие места и позволить бизнес-подразделениям легче обрабатывать свои собственные запросы на данные. Демократизируя данные, организации могут улучшить процесс принятия решений, позволив большему количеству людей вносить свой вклад в анализ и интерпретацию данных; укрепить сотрудничество между командами внутри организации; и повысить прозрачность, поскольку больше людей имеют доступ к информации и могут видеть, как принимаются решения, основанные на данных.

 

Ссылка на источник


0


Нет комментариев. Ваш будет первым!
Загрузка...