Способы и относящиеся к ним системы построения моделей и прогнозирования операционных результатов операции бурения

Иллюстрации

Показать все

Изобретение относится к области геофизики и может быть использовано для прогнозирования операционных результатов операции бурения. По меньшей мере некоторыми из иллюстративных вариантов осуществления являются способы, включающие в себя сбор данных датчиков относительно соседних скважин и контекстных данных относительно соседних скважин и размещение данных датчиков и контекстных данных в хранилище данных, создание сокращенного набора данных посредством идентификации корреляции между данными в хранилище данных и операционным результатом в операции бурения, создание модели на основе сокращенного набора данных и прогнозирование операционного результата на основе модели. При этом контекстные данные относятся к аспектам бурения, которые не измеряются физическими датчиками, ассоциированными с операцией бурения. Технический результат - повышение достоверности прогнозирования операционных результатов операции бурения. 3 н. и 24 з.п. ф-лы, 12 ил.

Реферат

ПРЕДПОСЫЛКИ

[0001] В контексте бурения углеводородной скважины, значительное количество данных может быть собрано одновременно с бурением, например, данные измерения во время бурения (MWD), данные каротажа во время бурения (LWD), и данные от массива датчиков в и вокруг буровой установки. Эти данные могут быть использованы в краткосрочной перспективе, чтобы принимать решения относительно бурения конкретного ствола скважины (например, регулирование направления бурения, решение о смене бурового долота). Однако данные относительно бурения конкретного ствола скважины не могут быть просмотрены еще раз после того, как ствол скважины пробурен, и даже если эти данные просмотрены и/или проанализированы на более позднюю дату, связь данных с операционными результатами других стволов скважин, пробуренных раньше по времени или позже во времени, трудно вывести.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0002] Для подробного описания примерных вариантов осуществления ссылки будут делаться на приложенные чертежи, на которых:

[0003] Фиг. 1 показывает в форме блок-схемы высокоуровневую диаграмму потока рабочего процесса в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0004] Фиг. 2 показывает визуальное изображение примерного рабочего процесса в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0005] Фиг. 3 показывает в форме блок-схемы примерный рабочий процесс в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0006] Фиг. 4 показывает в форме блок-схемы примерный рабочий процесс в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0007] Фиг. 5 показывает в форме блок-схемы примерный рабочий процесс в соответствии с по меньшей мере в некоторыми вариантами осуществления;

[0008] Фиг. 6 показывает примерный рабочий процесс в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0009] Фиг. 7 показывает в форме блок-схемы примерный рабочий процесс в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0010] Фиг. 8 показывает примерную операцию бурения в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0011] Фиг. 9 показывает в форме блок-схемы логическую операцию прогнозирующих сегментов в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0012] Фиг. 10 показывает в форме блок-схемы логическую операцию прогнозирующих сегментов в соответствии с по меньшей мере некоторыми вариантами осуществления;

[0013] Фиг. 11 показывает в форме блок-схемы компьютерную систему в соответствии с по меньшей мере некоторыми вариантами осуществления; и

[0014] Фиг. 12 показывает блок-схему последовательности операций в соответствии с по меньшей мере некоторыми вариантами осуществления.

ОБОЗНАЧЕНИЯ И ТЕРМИНОЛОГИЯ

[0015] Некоторые термины используются во всем нижеследующем описании и формуле изобретения для обозначения отдельных компонентов системы. Как будет понятно специалисту в данной области техники, различные компании могут ссылаться на компоненты под разными наименованиями. Настоящий документ не имеет намерения проводить различие между компонентами, которые отличаются по названию, но не по функции. В последующем обсуждении и в формуле изобретения термины "включающий" и "содержащий" используются в открытом смысле, и, таким образом, должны интерпретироваться, чтобы означать "в том числе, но не ограничиваясь указанным…".

[0018] Кроме того, термин "связывают" или "связывает" предназначен для обозначения либо опосредованного, либо непосредственного соединения. Таким образом, если первое устройство связано с вторым устройством, это соединение может быть осуществлено через прямое соединение или через косвенное соединение через другие устройства и соединения.

[0017] "Данные датчиков" означают данные, созданные физическими датчиками или на основе физических датчиков, ассоциированных с операцией бурения, где данные изменяются в зависимости от времени или изменяются в зависимости от глубины бурения. Примерами данных датчиков, созданных непосредственно физическими датчиками, являются: температура в скважине, измеряемая во время бурения; давление бурового раствора в забое скважины, измеряемое в процессе бурения; данные каротажа в процессе бурения; и данные измерения в процессе бурения. Примеры данных датчиков, созданных на основе (например, непосредственно выведенных из или вычисленных посредством детерминированного вычисления) физических датчиков, включают в себя скорость проходки (ROP) во время операции бурения и объем потерь бурового раствора как функцию времени/глубины.

[0018] "Контекстные данные" означают данные, относящиеся к аспектам операции бурения, которые не измеряются физическими датчиками, ассоциированными с операцией бурения. Примерами контекстных данных являются: многолетний опыт буровой бригады; тип используемого бурового долота; тип бурового раствора; суточная стоимость промыслового оборудования; физические характеристики подземного пласта.

[0019] "Соседняя (периферийная, подсасывающая) скважина” должно означать скважину, пробуренную в прошлом или пробуриваемую одновременно с проектной или фактической скважиной, представляющей интерес.

[0020] "Проектный ствол скважины" должно означать ствол скважины или части ствола скважины, который еще должен быть пробурен.

[0021] "В реальном времени" по отношению к данным должно означать данные, которые были измерены или созданы в течение последнего часа.

[0022] "Алгоритм машинного обучения" должно означать компьютерную программу, которая выполняет задачу, чтобы после обучения компьютерной программы выполнять задачу с помощью набора обучающих данных. Алгоритмы машинного обучения могут включать в себя искусственные нейронные сети, векторные машины поддержки, алгоритмы обучения дерева решений и Байесовы сети.

[0023] "Очистка данных" должно означать удаление данных из набора данных, так что данные, оставшиеся в наборе данных, имеют улучшенную метрику качества.

[0024] "Параметры бурения" должно означать управляемую переменную операции бурения. Например, параметры бурения могут содержать: нагрузку на долото, давление бурового раствора, направление бурения, вращательную скорость бурильной колонны и вращательную скорость бурового долота, вращаемого забойным двигателем.

[0025] "Операционный результат" должно означать неуправляемую переменную или параметр операции бурения, фактическое или прогнозируемое значение или состояние которого изменяется, в некоторых случаях от изменений фактического(их) или прогнозируемого(ых) параметра(ов) бурения. Например, скорость проходки бурения через пласт является операционным результатом, потеря бурового раствора является операционным результатом, как и предсказание события прихвата труб.

[0026] "Многомерная структура данных" должно означать логическую конструкцию данных, построенных или сохраненных в многомерном пространстве в памяти с компьютерным доступом. "Многомерная структура данных" не должно трактоваться как требующее создания физической структуры.

ОРГАНИЗАЦИОННАЯ СВОДКА

[0027] Настоящее описание организовано в виде множества разделов и подразделов. Следующий обзор разделов и подразделов призван помочь читателю в понимании организационной структуры документа.

[0028] ОБЗОР

[0029] Хранение аналитических данных (сбор и хранение данных)

[0030] - Типы данных и исторические недостатки

[0031] - Создание хранилища данных

[0032] - Система интеграции данных

[0033] - Система очистки данных

[0034] - Хранилище данных

[0035] - Аспекты реального времени

[0036] - Хранение аналитических данных

[0037] Аналитика данных и построение модели

[0038] - Исследование данных

[0039] - Кластеризация

[0040] - Классификация данных посредством описательной статистики

[0041] - Классификация данных посредством инвариантных данных

[0042] - Классификация данных посредством вариантных данных

[0043] - Сегментация

[0044] - Создание схемы определения

[0045] - Обучение алгоритма машинного обучения

[0046] - Построение модели

[0047] - Обучение

[0048] - Тестирование

[0049] - Проверка и оценка

[0050] Прогнозная аналитика

[0051] - Примерная операционная среда

[0052] - Операционные методы

[0053] Соображения реализации

ПОДРОБНОЕ ОПИСАНИЕ

[0054] Следующее обсуждение направлено на различные варианты осуществления изобретения. Хотя один или более из этих вариантов осуществления могут быть предпочтительными, раскрытые варианты осуществления не должны толковаться или иным образом использоваться как ограничивающие объем раскрытия, включая формулу изобретения. Кроме того, специалисту в данной области техники должно быть понятно, что последующее описание имеет широкое применение, и обсуждение любого варианта осуществления означает только пример этого варианта осуществления, а не предназначается, чтобы подразумевать, что объем раскрытия, включая формулу изобретения, ограничен этим вариантом осуществления.

[0055] ОБЗОР

[0056] Различные варианты осуществления направлены на способы и соответствующие системы прогнозирования, либо перед бурением, либо одновременно с бурением, операционных (эксплуатационных) результатов операции бурения. Более конкретно, примеры способов и систем направлены на сбор и анализ больших объемов разнородных данных, генерируемых в отношении соседних скважин (например, данных датчиков, контекстных данных), выявление корреляции в данных, относящихся к операционным результатам в операции бурения, создание одной или более моделей на основе корреляций и прогнозирование операционных результатов (в том числе будущих событий), связанных с операцией бурения, на основе одного или более параметров.

[0057] Фиг. 1 показывает в форме блок-схемы высокоуровневую диаграмму рабочих процессов в соответствии с различными вариантами осуществления. Каждый из примерных рабочих процессов на фиг.1 представляет реализуемые компьютером методы, приводящие к созданию структур данных и/или программных средств, которые затем используются в следующем рабочем процессе. В частности, первый аспект содержит рабочий процесс 100 хранения аналитических данных. Рабочий процесс 100 хранения аналитических данных собирает данные датчиков и контекстные данные в соседних скважинах и помещает данные в хранилище данных, так что к данным (как датчиков, так и контекстным) может предоставляться доступ посредством универсального интерфейса прикладного программирования. Второй аспект включает в себя рабочий процесс 102 аналитики данных и построения модели. Примерный рабочий процесс 102 анализирует данные, полученные из хранилища данных рабочего процесса 100 хранения аналитических данных, чтобы выявлять корреляции среди прогнозных данных операционных результатов в процессе бурения. После того, как корреляции определены, сокращенный набор данных создается в рабочем процессе 102, содержащие данные, для которых были определены корреляции, и из сокращенного набора данных создаются одна или более прогнозирующих моделей. Прогнозирующие модели, созданные в рабочем процессе 102, затем применяются в рабочем процессе 104 прогнозирующей аналитики для прогнозирования одного или более операционных результатов (например, будущих значений операционного результата, будущих событий).

[0058] В некоторых случаях примерные рабочие процессы на фиг. 1 используются в качестве инструмента планирования. То есть, примерные рабочие процессы используются для планирования и прогнозирования параметров бурения для достижения прогнозируемых операционных результатов относительно ствола скважины, которая еще должна быть пробурена. Однако в других примерных системах рабочие процессы по фиг. 1 используются итерационно во время бурения ствола скважины. Таким образом, в примерных системах прогнозируемые операционные результаты используются в смысле замкнутого контура (как показано линией 106) вместе с данными датчиков реального времени и контекстными данными (как показано линией 108), чтобы уточнить модели (и, как обсуждается ниже, в некоторых случаях, чтобы выбрать из моделей-кандидатов) в процессе бурения ствола скважины. Каждый рабочий процесс будет обсуждаться, в свою очередь, начиная с рабочего процесса 100 хранения аналитических данных.

[0059] Хранение аналитических данных (сбор и хранение данных)

[0060] - Типы данных и исторические недостатки

[0061] Существуют несколько типов данных, ассоциированных с операцией бурения ствола скважины. В частности, буровая установка может быть ассоциирована с массивом датчиков, измеряющих параметры бурения, такие как давление бурового раствора на поверхности, скорость потока (расход) бурового раствора и скорость вращения бурильной колонны. Примерные отмеченные датчики создают поток данных, которое в большинстве случаев индексирован по времени (например, давление как функция времени, обороты в минуту (RPM) как функция времени). Кроме того, забойная компоновка бурильной колонны может содержать MWD и/или LWD инструменты, которые измеряют скважинные параметры бурения во время бурения. Пример скважинных параметров бурения может содержать скважинное давление бурения, нагрузку на буровое долото, скважинную температуру, наклон забойной компоновки, скорость вращения ротора турбобура и параметры пласта, измеренные LWD инструментами (например, сопротивление, пористость). Скважинные параметры бурения могут быть проиндексированы по времени или подобному времени параметру (например, глубине, которая может быть прослежена назад по времени, если необходимо, посредством коррелирования с моментом, когда скважинный датчик прошел упомянутую глубину). Различные типы данных, описанные в этом абзаце, будет упоминаться как данные датчиков. В большинстве случаев, данные датчиков являются данными большого объема, высокой частоты - это означает, что поток данных является почти непрерывным в течение времени, когда данные создаются, и включает в себя значительное количество информации.

[0062] Другим типом данных, представляющих интерес для настоящего описания, являются данные, ассоциированные с контекстом операции бурения. Примеры контекста могут содержать идентификатор оператора буровой (т.е. название компании), идентификатор буровой бригады, совокупный многолетний опыт буровой бригады, количество членов буровой бригады, тип используемого бурового раствора, тип использованного или используемого бурового долота, суточную стоимость промыслового оборудования (например, суточную стоимость буровой установки) и минералогию отдельной подземной формации. Различные данные, описанные в этом абзаце, будет упоминаться как контекстные данные. Следует отметить, что хотя примеры контекстных данных могут включать в себя данные с временной зависимостью (например, кумулятивный многолетний опыт буровой бригады), скорость, с которой изменяются контекстные данные как функция времени (например, дни, месяцы, годы), значительно медленнее, чем у данных датчиков (например, отсчеты давления, взятые и записанные 100 раз в секунду).

[0063] Примерные типы данных традиционно хранятся в различных и отдельных структурах данных. Например, MWD и LWD данные могут быть сохранены в документах расширяемого языка разметки (XML) и, более конкретно, как документы стандартного языка разметки переноса информации стороны скважины (WITSML), организованные и/или индексированные по времени/глубине. В отличие от этого, контекстные данные могут быть сохранены неиндексированным по времени способом, например, в реляционной базе данных (например, реляционной базе данных Модели данных инжиниринга (EDM™)). В других случаях, исторические данные (независимо от типа данных) относительно ствола скважины могут быть сохранены в формате хранения двоичного объекта большого размера (BLOB), которые не могут быть легко запрошены для извлечения соответствующей информации.

[0064] В известном уровне техники анализ исторических данных, охватывающих различные типы данных, затруднителен, если ни по какой другой причине, чем несходные данные, методы хранения данных делают сбор данных трудным и/или требующим значительных затрат времени. По этой причине, хотя различные нефтяные и газовые компании могут иметь и хранить значительные объемы исторических данных датчиков и контекстных данных, когда ствол скважины завершен, данные после этого не используются ни в прогнозировании операционных результатов проектируемых будущих стволов скважин, которые должны быть пробурены, ни во время бурения стволов скважин, бурение которых начинается после завершения соседних скважин.

[0065] - СОЗДАНИЕ ХРАНИЛИЩА ДАННЫХ

[0066] Фиг. 2 показывает визуальное изображение соотношения между различными типами данных и объединение в хранилище данных. В частности, фиг. 2 показывает данные датчиков и контекстные данные, ассоциированные с соседними скважинами. Различные типы данных, ассоциированные с соседними скважинами, предоставляются в систему 200 интеграции данных, которая, как следует из названия, объединяет исторические данные (как датчиков, так и контекстные) от различных соседних скважин. Система 200 интеграции данных более подробно обсуждается ниже. Собранные данные могут быть поданы в систему 202 очистки данных, которая выполняет различные функции выравнивания, сглаживания и интерполяции (также дополнительно обсуждены ниже). Продукт примерной системы по фиг. 2 представляет собой хранилище 204 данных, в котором хранятся различные типы данных из различных соседних скважин, и из которого данные доступны для последующих рабочих процессов (например, аналитики данных и построения модели и прогнозирующей аналитики). Сбор различных типов данных в “единое” хранилище данных обеспечивает не только возможность запрашивать по всей совокупности данных, хранящихся в хранилище данных, но и сокращает временные рамки для доступа, обеспечивающие принятие решений на основе данных в хранилище данных во временных рамках по шкале минут или часов (а не недель или месяцев). Настоящее описание сначала обращается к более подробному описанию системы 200 интеграции данных.

[0067] - СИСТЕМА ИНТЕГРАЦИИ ДАННЫХ

[0068] Все еще со ссылкой на фиг. 2, система 200 интеграции данных логически связана, по меньшей мере на начальном этапе, с данными датчиков и контекстными данными из множества соседних скважин. Как показано, система 200 интеграции данных связывается с данными 206 датчиков и контекстными данными 208 для "соседней скважины 1", связывается с данными 210 датчиков и контекстными данными 212 для "соседней скважины 2" и связывается с данными 214 датчиков и контекстными данными 216 для "соседней скважины N". Фиг. 2, таким образом, иллюстрирует, что данные интегрированы по множеству соседних скважин, а не ограничиваются только тремя соседними скважинами. В некоторых случаях, соседние скважины находятся в непосредственной близости от проектируемого или фактического ствола скважины, представляющего интерес. Например, соседние скважины могут быть всеми скважинами в области, которые были пробурены через и/или в тот же подземный углеводородный продуктивный слой. В других случаях, соседние скважины могут быть скважинами в целом регионе, даже охватывающем несколько целевых пластов. Кроме того, соседние скважины могут быть всеми скважинами, ранее пробуренными конкретным оператором, в некоторых случаях в любой точке мира.

[0069] В большинстве случаев данные 208, 210 и 214 датчиков каждой соседней скважины либо индексируются по времени, либо индексируются по глубине, которая является время-подобным параметром. Однако соседние скважины, скорее всего, пробурены в разные календарные дни (то есть, в разные моменты времени). Кроме того, даже если соседние скважины могут быть пробурены через и/или в те же подземные углеводородные пласты, высота поверхности каждого ствола скважины может быть различной, и, кроме того абсолютная глубина углеводородного продуктивного пласта может отличаться для каждой соседней скважины ввиду того, что углеводородные продуктивные пласты могут пролегать в иных, чем полностью горизонтальные, ориентациях. Таким образом, для того, чтобы более легко анализировать данные по соседним скважинам, система 200 интеграции данных может выполнять различные процедуры выравнивания, такие как выравнивание временных баз (например, время начала операций бурения) и выравнивание или компенсация различий высоты поверхности и/или подземного пласта (например, выравнивание к высоте опорного базиса).

[0070] В некоторых примерных системах, плотность данных из данных датчиков может быть больше, чем необходимо для прогнозирования одного или нескольких операционных результатов. Например, некоторые данные датчиков могут включать в себя сотни выборок в секунду, однако плотность данных в сотни выборок в секунду может не требоваться для прогнозирования операционных результатов, таких как ROP, эффективность бригады бурения или потеря бурового раствора. Таким образом, в некоторых примерных системах система 200 интеграции данных может выполнять функцию понижающей дискретизации данных, посредством которой число выборок данных снижается. В примерном случае набора данных датчиков, имеющих сотни выборок в секунду, система 200 интеграции данных может снизить частоту дискретизации до одной выборки в секунду. Любой подходящий способ может быть использован для понижающей дискретизации данных, такой как выбор усредненного значения, выбор среднего значения или случайный выбор. Следует отметить, что понижающая дискретизация не обязательно выполняется в любой ситуации, так как операционный результат, подлежащий прогнозированию, может потребовать более высоких частот дискретизации для точности.

[0071] С другой стороны, в некоторых случаях данные датчиков могут быть прерывистыми по периоду выборки или глубине. Например, степень естественного искривления ствола скважины может быть определена по отношению к конкретным съемочным точкам (т.е. глубинам) в стволе скважины, но не всем глубинам. Система 200 интеграции данных может, таким образом, распространить некоторые локализованные данные на другие глубины, используя любой подходящий механизм, такой как прямая линейная интерполяция различных алгоритмов подгонки кривой.

[0072] Помимо данных датчиков и проблем с выравниванием, система 200 интеграции данных также выполняет свертку контекстных данных 208, 212 и 216 от соседних скважин. В некоторых случаях, контекстные данные не имеют фактической временной зависимости (например, минералогия), но могут быть отнесены к временной зависимости с "периодом времени", охватываемым данными датчиков. В примере минералогии, временная зависимость может быть отнесена к периодам времени, когда соседняя скважина была пробурена через пласт с приписываемой минералогией. Другие контекстные данные имеют временную зависимость (например, используемое буровое долото), но такая временная зависимость является медленно меняющейся по сравнению с данными датчиков. Здесь снова, система 200 интеграции данных может приписывать временную зависимость по мере необходимости. В примере используемого бурового долота, временная зависимость может быть приписана к периодам времени (и/или глубинам), когда использовалось конкретное буровое долото. Другие контекстные данные могут не иметь временной зависимости или иметь временную зависимость, которая изменяется настолько медленно, что временная зависимость может рассматриваться как постоянная в течение промежутка времени сбора данных датчиков (например, количество лет опыта буровой бригады). Здесь снова, система 200 интеграции данных может применить зависимость времени/глубины, как необходимо для "выравнивания". В примере с количеством лет опыта буровой бригады, временная зависимость может устанавливаться системой 200 интеграции данных как постоянная по промежутку времени сбора данных датчиков.

[0073] - СИСТЕМА ОЧИСТКИ ДАННЫХ

[0074] В некоторых примерных системах данные, представленные в хранилище данных, очищаются перед использованием для дальнейших рабочих процессов, отмеченных на фиг. 1. На фиг. 2 система 202 очистки данных показана как логически находящаяся между системой 200 интеграции данных и фактическим хранилищем 204 данных. Следовательно, в некоторых случаях аспекты очистки данных выполняются перед вводом данных в хранилище данных. Однако в других вариантах осуществления данные могут быть помещены в хранилище 204 данных, а затем проанализированы и очищены, как желательно.

[0075] В некоторых примерных системах, система 202 очистки данных 202 выполняет множество типов анализа данных как часть очистки, в том числе удаление данных, когда это необходимо, и настройку значений, когда это необходимо. Примерные методы, используемые системой очистки данных, могут включать в себя идентификацию и удаление недействительных данных, детерминированные методы для идентификации аномалий данных и вероятностные методы для идентификации аномалий данных. Каждый из них будет обсуждаться по очереди.

[0076] Одним способом очистки является удаление недействительных данных. Примеры недействительных данных, которые могут быть удалены, содержат текстовые строки в полях значений, значения в полях текстовых строк, пустые поля, где ожидались значения, заполнители записей, такие как "TBD" и "NA", и тому подобное. Иначе говоря, примерный аспект "недействительных данных" очистки данных может выполнять проверку на наличие недействительных данных, принимая во внимание ожидаемый тип данных, подвергаемых анализу, и любые такие идентифицированные недействительные данные могут быть удалены.

[0077] В дополнение или вместо аспектов удаления данных очистки данных, обсужденной выше, примерная система 202 очистки данных может применять детерминированные методы для идентификации аномалий данных, не идентифицированных в анализе недействительных данных. Например, даже в группе значений данных датчиков, где каждый член данных в группе не является недействительным, части данных могут, тем не менее, представлять "плохие" данные. Рассмотрим, в качестве примера, упрощенную группу значений насыщенности газа для непрерывного пласта как функцию глубины (90%, 91%, 90%, 20%, 90%, 89%). Каждое из значений в примерной группе может попасть в пределы ожидаемого диапазона значений насыщения газом для пласта; однако, маловероятно, что насыщение газом пласта по непрерывным глубинам резко упадет до 20%, когда в примыкающих глубинах насыщение газом измеряется как 90%.

[0078] Таким образом, в соответствии с по меньшей мере некоторыми примерными системами, данные очищаются путем детерминированных статистических методов (например, анализ стандартного отклонения, анализ хи-квадратичного распределения). Для примерной группы значений, указанных выше, анализ стандартного отклонения группы по каждому отдельному элементу выявил бы 20% значение как множество стандартных отклонений ниже среднего или усредненного (даже с учетом 20% значения в вычислении значения стандартного отклонения). Для каждого элемента данных, найденного подозрительным при статистических вычислениях, система очистки данных может удалить элемент данных и/или заменить элемент данных.

[0079] Кроме того, система 202 очистки данных может применять детерминированные фильтры для данных, чтобы идентифицировать выпадающие из диапазона значения для любого конкретного контекста. Рассмотрим, в качестве примера, элемент данных, индексированный по глубине 90000 футов в скважине, где общая длина ствола скважины 2000 футов. В этой примерной ситуации примерный элемент данных находится вне логической границы общей длины ствола скважины, и, таким образом, примерный элемент данных может быть удален. В качестве другого примера рассмотрим значения вне диапазона, такие как отрицательная нагрузка на буровое долото (WOB) или отрицательная ROP в процессе бурения. Опять же, эти значения вне ограничений могут быть удалены. Иначе говоря, система 202 очистки данных может применять полученные данные к детерминированным (то есть, вопросам с ответом да/нет) испытаниям (например, испытание на минимальное/максимальное значение, испытания граничных значений в соответствии с требованиями) как часть методов очистки данных.

[0080] Кроме того, в дополнение или вместо детерминированных тестов, примерная система 202 очистки данных может применять вероятностные методы (например, в методах интеллектуального анализа данных эти данные могут анализироваться на наличие аномалий на основе шаблона), чтобы идентифицировать аномалии данных, не идентифицированные в детерминированном анализе. Например, крутящий момент, число оборотов в минуту и амперная нагрузка верхнего приводного двигателя являются тремя параметрами бурения, которые имеют очень высокие корреляции. Если два параметра следуют тем же трендам (трендам, которые могут быть сложными, связывающими смесь общего полу-линейного увеличения, синусоидальных колебаний и полу-случайных выбросов), а третий параметр временами не следует им, то моменты, когда последний не согласуется, могут быть отброшены. Должно быть принято во внимание, что методы интеллектуального анализа данных и алгоритмы очистки, так же, как понижающая дискретизация, всегда должны выполняться в контексте желательного результата. Например, в предыдущем примере, если результат заключается в использовании чистого сигнала, который моделирует скважинное вращение, такая очистка может быть уместной. С другой стороны, такое отсутствие корреляции, как правило, указывает на неисправные датчики, и, следовательно, такая очистка может не выполняться, если желаемым результатом было предсказать неисправность датчика. В некоторых случаях, вероятностный анализ может быть выполнен с помощью алгоритма машинного обучения (например, векторной машины поддержки (SVM)). В частности, шаблоны, указывающие на аномалии данных, могут быть предопределенными или могут быть определены на основе анализа поднабора полных данных. Несмотря на это, данные (или баланс данных) могут быть проанализированы с помощью SVM, чтобы идентифицировать (или дополнительно идентифицировать) шаблоны, указывающие аномалии. В некоторых примерных системах, данные, идентифицированные с использованием вероятностных методов, удаляются. В других случаях, данные, идентифицированные с использованием вероятностных методов, будут скорректированы. В еще других случаях данные, идентифицированные с использованием вероятностных методов, остаются неизменными, а значение, указывающее на качество данных, может быть соответствующим образом скорректировано на основе идентифицированных аномалий.

[0081] - ХРАНИЛИЩЕ ДАННЫХ

[0082] Снова со ссылкой на фиг. 2, хранилище 204 данных может принимать любую подходящую форму. Что касается данных датчиков, в соответствии с различными вариантами осуществления, хранилище данных реализует схему хранения, которая позволяет осуществлять достаточно быстрый доступ к данным датчиков, которые будут использоваться для других последующих аспектов, обсуждаемых дополнительно ниже. В частности, данные датчиков могут быть сохранены в многоколонном формате (например, HBase на Hadoop распределенной файловой системы) с индексацией по времени. Однако один только индекс времени может оказаться недостаточным для обеспечения подходящего времени доступа в условиях большого объема данных, и, таким образом, примерные варианты осуществления также включают в себя индексную структуру 230 "поверх” многоколонных данных хранилища 204 данных, так что начальное индексирование может находиться в индексной структуре 230 в качестве грубого искателя местоположения, с последующей точной индексацией в данных многоколонного формата. Таким образом, посредством интерфейса прикладного программирования (API) вставки, индексированные данные временных рядов могут быть быстро вставлены в базу данных временных рядов и путем извлечения информации API могут быть считаны и использованы для других аспектов, рассмотренных ниже более подробно.

[0083] В некоторых случаях отсутствующие данные от различных соседних скважин создаются любым подходящим способом с помощью системы 200 интеграции данных. Однако в других случаях с отсутствующими данными обращаются другими способами. Например, на фиг. 2 хранилище 204 данных ассоциировано с серверным процессором 232 интерполяции. В частности, в дополнение или вместо системы 200 интеграции данных, выполняющей интерполяцию для замены отсутствующих данных, процессор 232 интерполяции может обеспечивать функцию интерполяции для любых запрошенных данных, которые в противном случае отсутствуют в хранилище 204 данных. В случае исторических данных соседних скважин, количество времени, необходимое для выполнения функции интерполяции недостающих данных, может не представлять важности. То есть, для целей прогнозирования операционных результатов для ствола скважины, которая еще должна быть пробурена, количество времени, необходимое для интерполяции данных в рамках системы 200 интеграции данных, может не представлять важности. Однако для прогнозирования операционных результатов в реальном времени с бурением и создания данных датчиков в реальном времени, система может отказаться от интерполяции для пропущенных данных, если и пока данные не будут запрошены из структуры данных, и в этом случае процессор 232 интерполяции может выполнять задачу в реальном времени с запросом.

[0084] В то время как фиг. 2 показывает хранилище 204 данных в виде единого "объекта", следует понимать, что хранилище 204 данных может охватывать множество накопителей на дисках, множество массивов накопителей на дисках и/или множество компьютерных систем. В некоторых случаях, хранилище данных может быть реализованы на "облаке", и, таким образом, количество компьютерных систем, а также их соответствующие местоположения могут не быть известны и/или могут изменяться с загрузкой. В примерных системах единый унифицированной API используется для размещения данных в хранилище данных и считывания данных из хранилища данных, и API не обязательно ограничивается, чтобы работать с одним физическим местоположением для хранилищ 204 данных.

[0085] - АСПЕКТЫ РЕАЛЬНОГО ВРЕМЕНИ

[0086] Все еще со ссылкой на фиг. 2, различные варианты осуществления, обсуждаемые в данный момент, в основном ссылались на сбор данных датчиков относительно соседних скважин и контекстных данных относительно соседних скважин, а также размещение данных в хранилище данных для использования для дальнейшего анализа. Однако в других случаях части данных датчиков могут быть данными датчиков в реальном времени, и контекстные данные ассоциированы с данными датчиков в реальном времени. Таким образом, те же методы, используемые в отношении соседних скважин, для сбора несходных типов данных и вставки данных в хранилище данных (включая аспекты очистки данных) могут быть реализованы в примерной системе в реальном времени с бурением ствола скважины, представляющего интерес. В частности, фиг. 2 показывает данные датчиков реального времени и ассоциированные контекстные данные для представляющего интерес ствола скважины, подаваемые в систему 200 интеграции данных, посредством стрелок 240 и 242, соответственно. В большинстве случаев, интеграция данных, выполняемая по отношению к соседним скважинам, будет завершена к тому времени, когда применяются данные датчиков реального времени, так что только данные датчиков реального времени и связанные с ними контекстные данные рассматриваются системой 200 интеграции данных. Однако в случае скважин, пробуриваемых одновременно, данные соседних скважин также могут быть данными "реального времени". Иначе говоря, работающая система может содержать данные соседних скважин, также создаваемые в "реальном времени", но для простоты описания в настоящем описании будет считаться, что данные соседних скважин все являются историческими данными.

[0087] - ХРАНЕНИЕ АНАЛИТИЧЕСКИХ ДАННЫХ

[0088] Конечным результатом рабочего процесса хранения 100 аналитических данных является хранилище данных с данными из множества соседних скважин, и в случае операций в реальном времени хранилище данных может быть постоянно растущим в размерах, начиная первоначально с данных соседних скважин и увели