Data Mining

Что такое Data Mining:

Data mining - это английский термин, связанный с информатикой, перевод которого - интеллектуальный анализ данных . Он состоит из функциональности, которая агрегирует и систематизирует данные, находя в них соответствующие закономерности, ассоциации, изменения и аномалии .

Термин « интеллектуальный анализ данных» впервые появился в 1990 году в сообществах баз данных. Интеллектуальный анализ данных - это этап анализа процесса, известный как KDD ( Обнаружение знаний в базах данных ), буквальным переводом которого является «Обнаружение знаний в базах данных».

Интеллектуальный анализ данных можно разделить на несколько основных этапов: исследование, построение модели, определение шаблона, а также проверка и проверка.

Интеллектуальный анализ данных - сравнительно недавняя практика в мире вычислений, и он использует поиск информации, искусственный интеллект, распознавание образов и статистические методы для поиска корреляций между различными данными, которые позволяют вам получить полезные знания для компании или отдельного лица. Для компании интеллектуальный анализ данных может стать важным инструментом повышения инноваций и прибыльности.

Использование интеллектуального анализа данных довольно распространено в больших базах данных, и конечный результат их использования может отображаться через правила, гипотезы, деревья решений, дендрограммы и т. Д.

Хорошо выполненный анализ данных должен выполнять такие задачи, как: обнаружение аномалий, изучение правил ассоциации (моделирование зависимостей), кластеризация, классификация, регрессия и суммирование. Процесс интеллектуального анализа данных обычно происходит с использованием данных, содержащихся в хранилище данных .

Есть несколько компаний и программного обеспечения, которые занимаются интеллектуальным анализом данных, поскольку идентификация шаблонов в базах данных становится все более важной. Тем не менее, определение соответствующих стандартов не является уникальным для компьютерного мира. Человеческий мозг использует аналогичный процесс для выявления закономерностей и получения знаний.

В последние годы интеллектуальный анализ данных широко используется в таких областях науки и техники, как биоинформатика, генетика, медицина, образование и электротехника.

Концепция интеллектуального анализа данных часто связана с извлечением информации о поведении людей. По этой причине в некоторых ситуациях при извлечении данных возникают правовые вопросы и проблемы, связанные с конфиденциальностью и этикой. Несмотря на это, многие люди утверждают, что интеллектуальный анализ данных является этически нейтральным, поскольку он не имеет этических последствий.

Примеры добычи реальных данных

Интеллектуальный анализ данных часто используется компаниями и организациями для получения знаний о пользователях / сотрудниках / клиентах. Например, в государственном секторе можно провести перекрестную проверку между семейным положением работника и заработной платой, которую он получает, чтобы увидеть, влияет ли это на его семейную жизнь.

Такие компании, как сети супермаркетов, могут использовать эти перекрестные данные для определения продуктов, которые приобретаются вместе. Если клиент, который покупает продукт X, также покупает продукт Y, может быть, стоит расположить эти два продукта рядом, чтобы их было проще купить.