Интеллектуальные ярусы данных резервного копирования

Иллюстрации

Показать все

Изобретение относится к области распределения информации резервного копирования по местоположениям хранения в основанной на сети архитектуре резервного копирования. Техническим результатом является повышение эффективности резервного копирования. Может быть реализовано виртуальное распределение по уровням информации резервного копирования в местоположениях хранения в архитектуре резервного копирования. Статистические модели используются, чтобы динамически перераспределять информацию резервного копирования среди местоположений хранения и/или уровней, чтобы гарантировать доступность данных, минимальную задержку при восстановлении и минимальное использование полосы частот при восстановлении. Кроме того, эвристические способы или способы машинного обучения могут применяться, чтобы упреждающе обнаруживать отказы или другие изменения в местоположениях хранения таким образом, что информация резервного копирования может быть перераспределена соответственно до возникновения отказа. 2 н. и 13 з.п. ф-лы, 10 ил.

Реферат

УРОВЕНЬ ТЕХНИКИ

[0001] Поскольку вычислительные устройства становятся более распространенными и широко используемыми среди простого населения, количество данных, генерируемых и используемых такими устройствами, быстро увеличилось. Например, недавние достижения в технологии вычислений и хранения данных позволили даже устройствам с наиболее ограниченным форм-фактором сохранять и обрабатывать большие объемы информации для множества требующих данных приложений, таких как редактирование документов, обработка аудио-визуальной информации и т.п. Кроме того, недавние достижения в технологии связи могут позволить вычислительным устройствам передавать данные на высокой скорости передачи. Эти достижения привели, помимо других технологий, к реализации распределенных вычислительных услуг, которые могут, например, быть выполнены с использованием вычислительных устройств во множественных местоположениях в сети. Кроме того, такие достижения обеспечивают реализацию услуг, таких как основанное на сети резервное копирование, которые позволяют пользователю вычислительного устройства поддерживать одну или более резервных копий данных, ассоциированных с вычислительным устройством в удаленном местоположении в сети.

[0002] Существующие решения резервного копирования системы и/или данных позволяют пользователю сохранять информацию резервного копирования в местоположении и/или носителях, отдельных от его оригинального источника. Таким образом, например, может быть выполнено резервное копирование данных из вычислительного устройства из накопителя на жестких дисках на внешние носители, такие как накопитель на магнитной ленте, внешний накопитель на жестких дисках, или подобное. Однако, при реализации основанных на сети решений резервного копирования и/или других, которые могут быть использованы, чтобы обеспечить физически удаленные местоположения для хранения данных резервного копирования, затраты и сложность, ассоциированные с передачей и восстановлением пользовательских данных между пользовательской машиной и удаленным местоположением хранения, могут существенно ограничить полноценность системы резервного копирования. Например, в случае, когда данные резервного копирования (резервные данные) хранятся в удаленном сетевом местоположении, данные, ассоциированные с соответствующими версиями оригинальной копии образа файла и/или системы, могут быть переданы к удаленному запоминающему устройству, где соответствующие версии позднее могут быть извлечены для восстановления. Однако, в таком примере большое количество данных обычно передается по сети, таким образом потребляя дорогую полосу частот. Ввиду предшествующего было бы желательно реализовать на основании сети способы резервного копирования с улучшенной эффективностью.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0003] Нижеследующее представляет упрощенную сущность изобретения, чтобы обеспечить базовое понимание небольшого количества аспектов, описанных здесь. Этот раздел не является обширным кратким обзором заявленного предмета изобретения. Он не предназначен ни чтобы идентифицировать ключевые или критические элементы заявленного изобретения ни чтобы очертить объем предмета изобретения. Единственная цель состоит в том, чтобы представить некоторые понятия заявленного предмета изобретения в упрощенной форме в качестве введения к более подробному описанию, которое представлено ниже.

[0004] Изобретение относится к системам и/или способам, которые облегчают интеллектуальное распределение резервируемой информации по местоположениям хранения в основанной на сети архитектуре резервного копирования. Может быть реализовано виртуальное распределение по уровням информации резервного копирования по местоположениям хранения в архитектуре резервного копирования. Статистические модели используются, чтобы динамически перераспределить информацию резервного копирования среди местоположений хранения, и/или уровней, чтобы гарантировать доступность данных, минимальную задержку при восстановлении, и минимальное использование полосы частот при восстановлении. Информация резервного копирования может быть контролируемой, чтобы обнаружить тенденции доступа с течением времени. Кроме того, местоположения хранения могут контролироваться, чтобы идентифицировать степень исправности, емкость запоминающего устройства, полосу частот, и так далее. Информация, собранная посредством контроля, может быть применена к эвристике, относящейся к шаблонам доступа и/или механизмам машинного обучения, чтобы факторизовать продолжительность жизни данных в решения распределения. В другом примере механизмы машинного обучения могут быть применены к упреждающему обнаружению отказов или других изменений в местоположениях хранения таким образом, что информация резервного копирования может быть перераспределена соответственно до отказа или другого инцидента.

[0005] В соответствии с одним аспектом, гибридная архитектура резервного копирования может использоваться, в которой данные резервного копирования могут быть сохранены в глобальном местоположении в пределах сети или объединенной сети (например, "облаке"), а также в одном или более одноранговых узлах. Соответственно, некоторые или все данные резервного копирования могут быть получены или из облака или из соседнего однорангового узла, таким образом уменьшая задержку и потребление полосы частот, ассоциированных с операциями восстановления. В одном примере выбор местоположений, которые должны быть использованы для хранения и/или восстановления информации резервного копирования, может быть осуществлен интеллектуальным и автоматизированным способом, основанным на факторах, таких как, но не ограничиваясь ими, доступность местоположений, топология сети, ресурсы местоположений или подобных.

[0006] Нижеследующее описание и приложенные чертежи формулируют подробно некоторые иллюстративные аспекты заявленного изобретения. Эти аспекты являются указывающими, однако, только несколько из различных путей, которыми могут использоваться принципы изобретения, и заявленное изобретение предназначено, чтобы включать в себя все такие аспекты и их эквиваленты. Другие преимущества и новые признаки заявленного изобретения станут очевидными из нижеследующего подробного описания изобретения при рассмотрении совместно с чертежами.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0007] Фиг. 1 иллюстрирует блок-схему примерной системы, которая облегчает использование интеллектуального перераспределения данных по местоположениям хранения в соответствии с различными аспектами.

[0008] Фиг. 2 иллюстрирует блок-схему примерной системы, которая облегчает генерирование информации резервного копирования в соответствии с различными аспектами.

[0009] Фиг. 3 иллюстрирует блок-схему примерной системы, которая облегчает наблюдение и анализ информации резервного копирования и местоположений хранения в соответствии с одним или более аспектами.

[0010] Фиг. 4 иллюстрирует блок-схему примерной системы, которая облегчает интеллектуальное распределение информации резервного копирования по местоположениям хранения в соответствии с различными аспектами.

[0011] Фиг. 5 иллюстрирует блок-схему примерной сетевой архитектуры, которая может быть использована совместно с различными аспектами, описанными в настоящем описании.

[0012] Фиг. 6 иллюстрирует блок-схему примерной системы, которая облегчает проведение восстановления в гибридной архитектуре резервного копирования, основанной на облаке и одноранговых соединениях, в соответствии с различными аспектами.

[0013] Фиг. 7 иллюстрирует примерный способ для перераспределения данных среди уровней данных, реализованных на одном или более узлах хранения в соответствии с различными аспектами.

[0014] Фиг. 8 иллюстрирует примерный способ для перераспределения данных резервного копирования на основании информации использования данных в соответствии с различными аспектами.

[0015] Фиг. 9 иллюстрирует примерную сетевую среду, в которой могут использоваться новые аспекты заявленного изобретения.

[0016] Фиг. 10 иллюстрирует примерную операционную среду, которая может использоваться в соответствии с заявленным изобретением.

ПОДРОБНОЕ ОПИСАНИЕ

[0017] Изобретение описано со ссылками на чертежи, на которых аналогичные цифровые ссылочные позиции используются, чтобы ссылаться на аналогичные элементы по всему описанию. В нижеследующем описании в целях объяснения многочисленные конкретные детали сформулированы, чтобы обеспечить полное понимание объекта изобретения. Может быть очевидно, однако, что заявленное изобретение может быть осуществлено без этих конкретных деталей. В других случаях известные структуры и устройства показаны в форме блок-схемы, чтобы облегчить описание объекта изобретения.

[0018] Используемые здесь термины "компонент", "система", "хранилище данных," "облако," "одноранговый объект", "супер одноранговый объект," "клиент" и т.п. предназначены, чтобы относиться к связанному с компьютером объекту, или аппаратному обеспечению, программному обеспечению при реализации в аппаратном обеспечении, и/или программно-аппаратному обеспечению. Например, компонент может быть процессом, работающим на процессоре, объектом, выполняемым объектом, программой, функцией, библиотекой, подпрограммой и/или компьютером или комбинацией программного обеспечения и аппаратного обеспечения. В качестве иллюстрации, как приложение, работающее на сервере, так и сервер могут быть компонентом. Один или более компонентов могут постоянно находиться в пределах процесса, и компонент может быть локализован на одном компьютере и/или распределен между двумя или более компьютерами.

[0019] Различные аспекты будут представлены в терминах систем, которые могут включать в себя многие компоненты, модули и т.п. Должно быть понятно и оценено, что различные системы могут включать в себя дополнительные компоненты, модули и т.д. и/или могут не включать в себя все компоненты, модули и т.д., описанные со ссылками на чертежи. Комбинация этих подходов также может использоваться. Различные аспекты, раскрытые здесь, могут быть выполнены на электрических устройствах, включая устройства, которые используют технологии отображения с сенсорными экранами и/или интерфейсы типа мышь-и-клавиатура. Примеры таких устройств включают в себя компьютеры (настольный и мобильный), смартфоны, персональные цифровые помощники (PDA) и другие электронные устройства, как проводные, так и беспроводные.

[0020] Кроме того, заявленное изобретение может быть реализовано как способ, устройство или продукт изготовления, используя стандартные методы программирования и/или технические способы, чтобы произвести программное обеспечение, программно-аппаратные средства, аппаратное обеспечение или любую их комбинацию, чтобы управлять компьютером для реализации раскрытого изобретения. Термин "продукт изготовления", как используется здесь, предназначен, чтобы охватывать компьютерную программу, доступную с любого считываемого компьютером устройства, несущей или носителей. Например, считываемый компьютером носитель может включать в себя, но не ограничиваться, магнитные устройства хранения (например, жесткий диск, дискета, магнитные ленты…), оптические диски (например, компакт-диск (CD), цифровой универсальный диск (DVD)…), смарт-карты и устройства флэш-памяти (например, карта, стик, ключевой накопитель…). Дополнительно нужно оценить, что несущий сигнал может использоваться, чтобы нести считываемые компьютером электронные данные, например, используемые при передаче и приеме электронной почты или при доступе к сети, такой как Интернет или локальная сеть (ЛВС). Конечно, специалистам понятно, что много модификаций могут быть сделаны к этой конфигурации, не отступая от объема или формы заявленного изобретения.

[0021] Кроме того, слово "примерный" используется здесь, чтобы означать «служить примером, случаем или иллюстрацией». Любой аспект или структура, описанные здесь как "примерные", не должны быть обязательно рассмотрены как предпочтительные или выгодные перед другими аспектами или структурами. Вместо этого, использование слова "примерный" предназначено, чтобы раскрыть понятия конкретным способом. Как используется в настоящей заявке, термин "или" предназначен, чтобы означать включающее "или", а не исключительное "или". Таким образом, если не определено иначе или не ясно из контекста, "X использует A или B" предназначено, чтобы означать любую из естественных содержащих перестановок. Таким образом, если X использует A; X использует B; или X использует и A и B, то "X использует A или B" удовлетворяется любым из предшествующих случаев. Кроме того, использование единственного числа в настоящей заявке и приложенной формуле изобретения должно рассматриваться, чтобы означать "один или более", если не определено иначе или не ясно из контекста, что направлено на единственное число.

[0022] Теперь со ссылками на чертежи, Фиг. 1 иллюстрирует систему 100, которая облегчает использование интеллектуального перераспределения данных по местоположениям хранения в соответствии с различными аспектами В одном примере система 100 может быть использована для резервного копирования файлов, образов системы и/или других данных на клиентской машине, которая реализует и/или иначе ассоциирована с системой 100. В одном аспекте клиентская машина может быть персональным компьютером, ноутбуком, сервером, портативным цифровым помощником (PDA), мобильным устройством, смартфоном, сотовым телефоном, портативным игровым устройством, медиа плеером или любым другим подходящим вычислительным устройством, которое может хранить, управлять и/или передавать данные.

[0023] В соответствии с одним аспектом, система 100 может быть использована совместно с основанным на сети или решением онлайн резервного копирования (например, система резервного копирования из облака, как описано более подробно ниже), которое сохраняет информацию резервного копирования из клиентской машины в одном или более удаленных местоположениях хранения в сети или объединенной сети, с которой ассоциирована клиентская машина. Обычные решения онлайн резервного копирования выполняются посредством поддержания набора файлов, полученных от клиента резервного копирования в различные моменты во времени в удаленном местоположении хранения. Затем проводится восстановление посредством извлечения одного или более файлов из местоположений хранения по запросу. Поскольку размеры данных и системы растут, потребность экономии пространства и экономии полосы частот при передаче данных резервного копирования аналогично растет.

[0024] В то время как де-дублирование блоков данных и/или файлов в единственном экземпляре позволяет осуществлять более эффективное использование запоминающего устройства, могут быть реализованы дополнительные оптимизации. Например, могут быть реализованы оптимизации, которые уменьшают стоимость запоминающих устройств, уменьшают стоимость полосы частот, ассоциированных с данными передачи вокруг сети местоположений, и уменьшают задержку, ассоциированную с восстановлением данных. Адаптивные и/или упреждающие механизмы могут использоваться, которые облегчают конструирование и поддержание виртуальных уровней или ярусов данных. Ярусы данных могут быть интеллектуально распределены, а также непрерывно настраиваться так, чтобы гарантировать оптимальное размещение. Например, местоположения данных и/или запоминающих устройств могут контролироваться, чтобы разрешить динамическое перераспределение данных, чтобы гарантировать доступность данных, одновременно уменьшая затраты на хранение, задержку при восстановлении и полосу частот для восстановления.

[0025] Соответственно, чтобы обеспечить увеличенную доступность, а также пониженное использование ресурсов и затраты на восстановление, система 100 может интеллектуальным образом располагать по ярусам данные в решении распределенного резервного копирования. Более подробно, когда пользователь на клиентской машине выбирает часть данных (например, файл, образ системы и т.д.), для которых должно быть выполнено резервное копирование, компонент 102 контроля может начать оценку части данных. Кроме того, компонент 102 контроля непрерывно оценивает и отслеживает свойства других данных резервного копирования, сохраненных в местоположениях 106 хранения. В одном примере компонент 102 контроля наблюдает частоту и/или время доступа к данным резервного копирования с момента, когда данные резервного копирования были сгенерированы. В другом примере компонент 102 контроля может отслеживать доступность данных резервного копирования. Например, компонент 102 контроля может наблюдать количество точных копий части данных резервного копирования, распределенных по местоположениям 106 хранения.

[0026] В соответствии с другим аспектом, компонент 102 контроля может контролировать местоположения 106 хранения, чтобы отслеживать свойства. Например, свойства могут включать в себя степень исправности соответствующих местоположений (запоминающих устройств) хранения, емкость запоминающего устройства (например, общую и/или доступную емкость) местоположений хранения, доступность местоположений хранения (например, время простоя, продолжительность работы, и т.д.), использование полосы частот местоположений хранения, или предсказанные задержки для передачи данных между соответствующими местоположениями хранения. Такая информация о местоположениях хранения может облегчить упреждающее перераспределение данных резервного копирования и/или адаптивные распределения, на основании изменений в местоположениях хранения.

[0027] В соответствии с другим аспектом, компонент 104 яруса может быть использован, чтобы реализовать виртуальные уровни данных резервного копирования по местоположениям 106 хранения. В одном примере компонент 104 яруса может использовать эвристику, машинное обучение и/или другие подходящие методы искусственного интеллекта к данным резервного копирования уровня. В другом примере виртуальные уровни могут быть сконструированы относительно исходного местоположения (например, восстанавливающей клиентской машины) таким образом, что местоположение данных резервного копирования распределены по приоритетам. Например, данные резервного копирования, к которым часто обращаются и являются более новыми (например, как определено компонентом 102 контроля, например) могут быть сохранены в местоположении хранения, которое ближе к восстанавливающей клиентской машине в сети, чтобы уменьшить задержку, ассоциированную с восстановлением. Данные резервного копирования, которые являются более старыми и/или к которым нечасто обращаются, могут храниться в местоположениях хранения, которые являются более удаленными, но предлагают более дешевое или более избыточное пространство хранения (например, облако). В другом аспекте нужно оценить, что компонент 104 яруса может подчеркнуть доступность данных, к которым наиболее вероятно будет обращение или которые будут восстановлены (например, данные резервного копирования, которые недавно сгенерированы или к которым часто обращаются). Например, в дополнение к сокращению времен задержки и полосы частот, компонент 104 яруса может сохранить копии данных, которые, вероятно должны быть восстановлены, в удаленных местоположениях с избыточным объемом запоминающего устройства. Таким образом, данные резервного копирования могут остаться доступными, даже когда местоположение запоминающего устройства с оптимальным местоположением становится недоступным. Должно быть понятно, что компонент 104 яруса может управлять количеством копий, сохраненных в менее оптимальных местоположениях, чтобы сбалансировать затраты на хранение с доступностью.

[0028] В другом аспекте компонент 104 яруса может упреждающе перераспределять данные резервного копирования. Например, местоположение хранения контролируется компонентом 102 контроля для обнаружения, что клиентская машина испытывает критические отказы или неизбежные угрозы критических отказов. В ответ компонент 104 яруса может перераспределить данные, требуемые для восстановления клиентской машины, в местоположения хранения в пределах виртуальных уровней, чтобы обеспечить оптимальное местоположение и уменьшить задержку восстановления при восстановлении клиентской машины.

[0029] В другом примере компонент 104 яруса может использовать информацию, собранную компонентом 102 контроля. Компонент 104 яруса может обозначать данные резервного копирования как «горячие» данные или «холодные» данные. Горячие данные относятся данным резервного копирования, к которым часто обращаются и/или недавно сгенерированы (например, данные, для которых было выполнено резервное копирование). Компонент 104 яруса может логически вывести, что горячие данные более вероятно будут восстановлены и, соответственно, назначают такие данные уровням, соответствующим самому близкому местоположению, минимальной задержке для восстановления и/или самой высокой доступности. Холодные данные, напротив, могут относиться к информации резервного копирования, к которой нечасто обращаются и/или к более старым. Компонент 104 яруса может логически вывести, что холодные данные наименее вероятно будут восстановлены и распределить такие данные местоположениям, менее оптимальным в терминах местоположения, но предлагающим дешевое хранение.

[0030] Должно быть понятно, что система 100 может включать в себя любые подходящие и/или необходимые компоненты интерфейсов (не показаны), которые обеспечивают различные адаптеры, соединители, каналы, тракты связи и т.д., чтобы интегрировать компонент 102 контроля и компонент 104 яруса в фактически любое приложение, операцию и/или систему(ы) базы данных и/или друг с другом. Кроме того, компоненты интерфейса могут обеспечить различные адаптеры, соединители, каналы, тракты связи и т.д., которые предусматривают взаимодействие с и между компонентом 102 контроля, компонентом 104 яруса, местоположениями 106 хранения и/или любым другим компонентом, ассоциированным с системой 100.

[0031] Обращаясь к Фиг. 2, иллюстрируется система 200 для генерирования информации резервного копирования в соответствии с различными аспектами. Как иллюстрирует Фиг. 2, система 200 может включать в себя компонент 202 резервного копирования, который может генерировать и облегчать хранение резервных копий файлов, мгновенного состояния системы, и/или другую информацию, ассоциированную с клиентской машиной резервного копирования. В одном примере компонент 202 резервного копирования может постоянно находиться на и/или работать из машины, на которой расположена информация клиента, для которой должно быть выполнено резервное копирование. Дополнительно или альтернативно, компонент 202 резервного копирования может постоянно находиться на неравноправном вычислительном устройстве (например, в качестве удаленно выполняемого компонента). В одном примере компонент 202 резервного копирования может быть использован, чтобы поддерживать набор файлов и/или другую информацию с регулярными интервалами во времени после инициирования одного или более событий (например, модификация файла), и/или на основании любых других подходящих критериев активирования.

[0032] В соответствии с одним аспектом, резервное копирование файла может быть проведено пошаговым способом компонентом 202 резервного копирования, чтобы уменьшить величину полосы частот и/или пространство хранения, требуемых для реализации системы 200. Это может быть достигнуто посредством, например, сначала деления файла, для которого должно быть выполнено резервное копирование, на соответствующие сегменты файла (например, блоки, части и т.д.), с использованием компонента 204 сегментации. В одном примере сегментация или деление файла может быть выполнено компонентом 212 сегментации способом, который облегчает де-дублирование соответствующих сегментов файла. Например, в конкретном неограничивающем примере компонент 204 сегментации может разделить первую версию файла в набор однородных и/или неоднородных блоков. В другом примере версии файла могут быть аналогично сегментированы, чтобы идентифицировать уникальные блоки между версиями. Например, после обнаружения модификации к файлу компонент 204 сегментации может повторно сегментировать этот файл способом, совместимым с сегментацией первой версии таким образом, что любые блоки в этом файле, которые отличаются в состоянии от первой версии до второй версии, являются легко идентифицируемыми. После обнаружения уникальных блоков в обновленной версии файла компонент 204 сегментации может облегчить пошаговое сохранение новых и/или измененных блоков, соответствующих файлу, а также другой информации, касающейся изменений между соответствующими версиями файла.

[0033] После генерирования блоков или сегментов, соответствующих файлу, различные блоки, соответствующие соответствующим файлам и/или обновлениям файла, могут быть выданы компоненту 206 распределения сегментов. Компонент 206 распределения сегментов может, в свою очередь, распределить блоки среди одного или более местоположений 106 хранения. Местоположения 106 хранения могут соответствовать или быть ассоциированы с, например, одноранговыми машинами в локальной сети, службами хранения в облаке и/или другом подходящем основанном на Интернете местоположении хранения и/или любом другом узле хранения. Способы для распределения информации среди местоположений хранения сети описаны более подробно ниже. Посредством конкретного неограничивающего примера блоки могут быть предварительно сконфигурированы до однородного размера (например, 4 килобайта (КБ)), должно быть понятно, однако, что любой подходящий размер блока должен использоваться.

[0034] Фиг. 3 иллюстрирует систему 300, которая облегчает наблюдение и анализ информации резервного копирования (резервного копирования) и местоположений хранения в соответствии с одним или более аспектами. Как иллюстрируется на Фиг. 3, система 300 может включать в себя компонент 302 контроля, который может наблюдать информацию резервного копирования и/или местоположения хранения для захвата данных, которые относятся к свойствам, характеристикам или тенденциям, ассоциированным с местоположениями хранения. Захваченные данные могут использоваться, чтобы облегчить интеллектуальное распределение данных резервного копирования среди местоположений хранения. Кроме того, эти данные могут облегчить адаптивные перераспределения и упреждающее смещение данных в ответ на изменения в данных резервного копирования или местоположениях хранения.

[0035] В соответствии с одним аспектом компонент 102 контроля может включать в себя компонент 302 оценки данных, который анализирует данные резервного копирования, хранимые местоположениями 106 хранения. В одном примере компонент 302 оценки данных может контролировать данные резервного копирования (например, блоки данных), чтобы отслеживать доступы к отдельным блокам. Посредством отслеживания доступа компонент 302 оценки данных может установить частоту доступа для соответствующих блоков данных. Должно быть понятно, что частота доступа может быть по множеству периодов времени. Например, частота доступа может быть охарактеризована за час, день, неделю, месяц и так далее. Кроме того, частота доступа может быть предоставлена как полная частота, начиная с генерирования блоков данных. В другом примере компонент 302 оценки данных может поддерживать время создания для блоков данных. В другом аспекте компонент 302 оценки данных может контролировать доступность блока данных резервного копирования. Например, компонент 302 оценки данных может подсчитывать количество точных копий (дубликатов) соответствующих блоков данных резервного копирования, которые распределены среди местоположений 106 хранения.

[0036] В соответствии с другим аспектом компонент 102 контроля может включать в себя компонент 304 оценки машины, который анализирует местоположения 106 хранения. В одном примере компонент 304 оценки машины может установить (выявить) свойства местоположений 106 хранения. Кроме того, свойства местоположений 106 хранения могут быть отслежены, чтобы контролировать изменения с течением времени. Свойства могут включать в себя степень исправности соответствующих местоположений хранения, емкость запоминающего устройства (например, общую и/или доступную емкость) местоположений хранения, доступность местоположений хранения (например, время простоя, продолжительность работы, и т.д.), использование полосы частот местоположений хранения, или предсказанные времена задержки для передачи данных между соответствующими местоположениями хранения. Информация, собранная посредством контроля местоположений 106 хранения, может облегчить предсказание отказов и упреждающее перемещение данных резервного копирования к оптимальному местоположению для отказавшей машины, чтобы реализовать эффективное восстановление с малой задержкой. Кроме того, эта информация может облегчить оптимальное размещение данных резервного копирования, которые максимизируют доступность, в то же время уменьшая задержку, затраты на хранение и затраты полосы частот.

[0037] Обращаясь к фиг. 4, иллюстрируется система 400, который облегчает интеллектуальное распределение информации резервного копирования к местоположениям хранения в соответствии с различными аспектами. В соответствии с одним аспектом, основанная на одноранговом соединении (P2P) и облаке гибридная архитектура может быть использована системой 400. Например, компонент 104 яруса может распространить или перераспределить информацию резервного копирования по местоположениям 106 хранения. Местоположения 106 хранения могут включать в себя один или более заслуживающих доверие одноранговых узлов, таких как одноранговый объект(ы) 402 и/или супер одноранговый объект(ы) 404, так же как одно или более местоположений 406 хранения в облаке. Как дополнительно иллюстрируется в системе 400, одноранговый объект(ы) 402, супер одноранговый объект(ы) 404 и/или запоминающее устройство 406 облака может также функционировать, чтобы обмениваться блоками данных резервного копирования и/или другой информацией резервного копирования друг с другом. Кроме того, может быть понятно, что компонент 104 яруса, любые другие компоненты системы 400 и/или компонент 102 контроля, описанные со ссылками на предыдущие чертежи, могут быть дополнительно ассоциированы с одним или более из одноранговых узлов 402, супер одноранговых узлов 404 или объектов, ассоциированных с запоминающим устройством 406 облака. Дополнительные детали относительно способов, которыми одноранговый объект(ы) 402, супер одноранговый узел(ы) 404 и запоминающее устройство 406 облака могут быть использованы, так же как дополнительные детали относительно функций таких объектов в гибридной архитектуре, предоставлены ниже.

[0038] В одном аспекте компонент 104 яруса создает виртуальные уровни или ярусы данных резервного копирования по местоположениям 106 хранения. Данные резервного копирования распределены среди уровней таким образом, что доступность и оптимальное местоположение поддерживается, уменьшая затраты на хранение, затраты полосы частот, и время задержки при восстановлении. Компонент 104 яруса может генерировать виртуальные уровни посредством распределения блоков (например, данных резервного копирования) к одному или более одноранговым узлам 402, супер одноранговым узлам 404, или запоминающему устройству 406 в облаке. Компонент 104 яруса может использовать результаты контроля из компонента 102 контроля, описанного выше, чтобы облегчить создание и обслуживание виртуальных уровней.

[0039] В соответствии с другим аспектом, компонент яруса 404 может включать в себя компонент, который назначает части данных резервного копирования (например, блоки, куски и т.д.) местоположениям 106 хранения в соответствии с результатами контроля. В одном примере компонент 408 распределения может использовать частоты доступа и возрасты блоков данных резервного копирования, чтобы определять блоки как горячие или холодные. Горячие данные относятся к блокам данных резервного копирования, к которым часто обращаются и/или которые недавно созданы (например, недавно сделана резервная копия), в то время как холодные данные относятся к данным, к которым нечасто обращаются и/или созданы длительное время назад. Компонент 408 распределения может назначать горячие данные местоположениям хранения, которые обеспечивают оптимальное местоположение для возможной восстанавливающей машины, такой как одноранговые узлы 402 и/или супер одноранговые узлы 404. Холодные данные могут быть помещены в местоположения хранения с менее оптимальным местоположением, но более дешевым избыточным запоминающим устройством, такие как супер одноранговый узел 404 и запоминающее устройство 406 из облака.

[0040] В другом примере компонент 408 распределения может принимать решения распределения на основании доступности данных резервного копирования, как предусмотрено в результатах контроля. Горячие данные, например, могут быть распространены среди одноранговых узлов 402, и уникальные де-дублированные блоки данных резервного копирования (например, блоки с малым количеством дубликатов) могут иметь дополнительные точные копии, сгенерированные и сохраненные в местоположениях с высокой надежностью (например, супер одноранговом узле 404 или облаке 406), чтобы увеличить доступность. Холодные данные могут быть пошагово перемещены в надежные местоположения хранения, такие как запоминающее устройство 406 из облака, во время непиковых времен или растянуто во времени. Соответственно, доступность холодных данных может быть понижена среди одноранговых узлов 402 или супер одноранговых узлов 404, чтобы уменьшить затраты на хранение. Кроме того, холодные данные могут быть подвергнуты способам сжатия, чтобы дополнительно снизить занимаемый объем хранения.

[0041] Компонент 408 распределения может перераспределить данные, на основании информации, собранной во время контроля местоположений 106 хранения. Например, отказы местоположений хранения могут быть предсказаны, и данные резервного копирования могут быть перераспределены соответственно. Например, данные резервного копирования, необходимые для восстановления отказавшей машины, могут быть перераспределены к местоположению в пределах оптимального местоположения к давшей сбой машине таким образом, что задержка восстановления должна быть минимизирована. В другом примере компонент 408 распределения может перераспределить или повторно распределить данные резервного копирования из местоположений хранения, показывающих индикации критических отказов.

[0042] В соответствии с другим аспектом, компонент 104 яруса может включать в себя и/или иначе быть ассоциирован с компонентом 412 индексации, который может поддерживать индекс (каталог), который перечисляет соотношения между блоками данных резервного копирования и местоположениями хранения, которым были распределены блоки. В одном примере компонент 410 индексации может добавить, удалить и/или изменить записи в индексе, когда компонент 104 яруса выполняет решения распределение и/или дублирования относительно блоков данных резервного копирования. В другом примере индекс может быть распределен наряду с данными резервного копирования, представленными в нем к еще одним одноранговым узлам 402, супер одноранговым узлам 404, или запоминающему устройству 406 из облака. Должно быть отмечено без ограничения или потери общности, что весь индекс может копироваться и сохраняться в одном или более местоположениях, или что индекс может быть разделен и распределен кусками среди множественных местоположений.

[0043] Как далее иллюстрирует система 400, компонент 412 машинного обучения и рассуждений (MLR) может использоваться, чтобы облегчить интеллектуальный автоматизированный выбор местоположений хранения для соответствующей информации. В одном примере компонент 412 MLR может использовать любой подходящий алгоритм(ы) искусственного интеллекта (AI), машинного обучения и/или другой а