Способ и устройство для осуществления записи объектного аудиосигнала и электронная аппаратура
Иллюстрации
Показать всеИзобретение относится к электронной аппаратуре и предназначено для записи объектного аудиосигнала. Технический результат – возможность осуществления прямой записи объектного аудиосигнала. Данный способ может включать в себя: выполнение операции сбора звуков путем одновременного использования множества микрофонов таким образом, чтобы был получен смешанный звуковой сигнал; идентификацию количества источников звука и информации о положении каждого источника звука и выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и объединение информации о положении и объектных звуковых сигналов отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала. 3 н. и 16 з.п. ф-лы, 19 ил., 2 табл.
Реферат
ПЕРЕКРЕСТНАЯ ССЫЛКА НА СВЯЗАННЫЕ ЗАЯВКИ
[0001] Настоящая заявка основана на Заявке №201510490373.6 на выдачу Китайского патента, все содержание которой включено в настоящий документ и по которой испрошен приоритет. Данная заявка была подана 11 августа 2015 года.
ОБЛАСТЬ ТЕХНИКИ
[0002] Настоящее изобретение, в целом, относится к технической области записи и, более конкретно, к способу и устройству для осуществления записи объектного аудиосигнала и к электронной аппаратуре.
УРОВЕНЬ ТЕХНИКИ
[0003] В феврале 2015 года следующее поколение стандарта аудиокодека MPEG-H 3D аудио Экспертной группы по движущемуся изображению (MPEG) официально стало международным стандартом ИСО/МЭК 23008-3. В рамках данного стандарта принят принципиально новый аудиоформат - объектный аудиосигнал, посредством которых можно идентифицировать ориентацию звука, таким образом, чтобы слушатель мог слышать звук, пришедший из конкретного направления, независимо от того, будет ли он использовать наушники или стереозвуковую систему, и от количества громкоговорителей.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0004] Данное изобретение предоставляет способ и устройство для
осуществления записи объектного аудиосигнала, а также электронную аппаратуру, созданные таким образом, чтобы устранить недостатки в соответствующей области техники.
[0005] В соответствии с первым аспектом осуществления данного изобретения, заявлен способ осуществления записи объектного аудиосигнала, включающий в себя:
[0006] выполнение операции сбора звуков с одновременным использованием множества микрофонов, таким образом, чтобы был получен смешанный звуковой сигнал;
[0007] идентификацию количества источников звука и информации о положении каждого источника звука и выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и
[0008] объединение информации о положении и объектного звукового сигнала отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала.
[0009] Дополнительно, идентификация количества источников звука и информации о положении каждого источника звука, а также выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона включают в себя:
[0010] идентификацию количества источников звука и информации о положении каждого источника звука и выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии с разностью амплитуд и разностью фаз, образованными среди соответствующих микрофонов звуковым сигналом, излучаемым каждым источником звука.
[0011] Дополнительно, идентификация количества источников звука и информации о положении каждого источника звука, а также выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона включают в себя:
[0012] идентификацию количества источников звука и информации о положении каждого источника звука из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и
[0013] выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом, установленной информацией о положении каждого микрофона, количеством источников звука и информацией о положении источников звука.
[0014] Дополнительно, выделение объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом, установленной информацией о положении каждого микрофона, количеством источников звука и информацией о положении источников звука включает в себя:
[0015] создание соответствующей статистической модели в соответствии с характеристическим показателем, сформированным звуковым сигналом, излучаемым каждым источником звука в предварительно заданном направлении; и
[0016] идентификацию и выделение звукового сигнала, соответствующего информации о положении любого источника звука в смешанном звуковом сигнале посредством статистической модели, как объектного звукового сигнала, соответствующего любому источнику звука.
[0017] Дополнительно, объединение информации о положении и объектных звуковых сигналов от отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала включает в себя:
[0018] объединение соответствующих объектных звуковых сигналов согласно порядку размещения отдельных источников звука таким образом, чтобы были получены аудиоданные множественных объектов;
[0019] объединение информации о положении отдельных источников звука в соответствии с порядком размещения, таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала; и
[0020] объединение информации файла заголовка, содержащей предварительно установленный параметр, аудиоданных множественных объектов и вспомогательных данных объектного аудиосигнала в порядке их поступления, таким образом, чтобы были получены аудиоданные в формате объектного аудиосигнала.
[0021] Дополнительно, объединение информации о положении и объектного звукового сигнала отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала включает в себя:
[0022] составление информации файла заголовка, содержащей предварительно установленный параметр, и отправка ее на предварительно настроенную аппаратуру для обработки аудиосигналов, при этом информация файла заголовка включает в себя продолжительность каждого фрейма аудиоданных; и
[0023] составление каждого фрейма аудиоданных в формате объектного аудиосигнала, соответствующих продолжительности каждого фрейма аудиоданных посредством выполнения следующих шагов, и отправку каждого фрейма аудиоданных в формате объектного аудиосигнала на предварительно настроенную аппаратуру для обработки аудиосигналов:
[0024] объединение соответствующих объектных звуковых сигналов согласно порядку размещения отдельных источников звука таким образом, чтобы были получены аудиоданные множественных объектов;
[0025] объединение информации о положении отдельных источников звука в соответствии с порядком размещения, таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала; и
[0026] объединение аудиоданных множественных объектов и вспомогательных данных объектного аудиосигнала в порядке их поступления, таким образом, чтобы был получен каждый фрейм аудиоданных в формате объектного аудиосигнала.
[0027] Дополнительно, объединение соответствующих объектных звуковых сигналов согласно порядку размещения отдельных источников звука таким образом, чтобы были получены аудиоданные множественных объектов, включает в себя:
[0028] дискретизацию объектных звуковых сигналов, соответствующих отдельным источникам звука, соответственно, в каждый момент времени дискретизации, согласно предварительно установленной частоте дискретизации, и компоновка всех дискретизированных сигналов в соответствии с порядком компоновки, таким образом, чтобы был получен объединенный дискретизированный сигнал; и
[0029] компоновка объединенных дискретизированных сигналов, получаемых в каждый момент времени дискретизации поочередно, в порядке дискретизации, таким образом, чтобы были получены аудиоданные множественных объектов.
[0030] Дополнительно, объединение информации о положении отдельных источников звука в соответствии с порядком размещения, таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала, включает в себя:
[0031] дискретизацию информации о положении, соответствующей отдельным источникам звука, в каждый момент времени дискретизации, согласно предварительно установленной частоте дискретизации, и запись каждой дискретизированной информации о положении в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации, таким образом, чтобы была получена объединенная дискретизированная информация о положении; и
[0032] компоновка объединенной дискретизированной информации о положении, получаемой в каждый момент времени дискретизации поочередно, в порядке дискретизации, таким образом, чтобы были получены аудиоданные множественных объектов.
[0033] Дополнительно, объединение информации о положении отдельных источников звука в соответствии с порядком размещения, таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала, включает в себя:
[0034] дискретизацию информации о положении, соответствующей отдельным источникам звука, согласно предварительно установленной частоте дискретизации;
[0035] при этом, если текущая точка дискретизации является первым моментом времени дискретизации, каждая полученная дискретизированная информация о положении записывается в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации; и если текущая точка дискретизации не является первым моментом времени дискретизации, полученная дискретизированная информация о положении каждого источника звука сравнивается с записанной ранее прежней дискретизированной информацией о положении того же самого источника звука, и при определении путем сравнения того, что они различны, дискретизированная информация о положении записывается в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации.
[0036] В соответствии со вторым аспектом осуществления данного изобретения, заявлено устройство для осуществления записи объектного аудиосигнала, включающее в себя:
[0037] блок сбора, сконфигурированный для выполнения операции сбора звуков с одновременным использованием множества микрофонов, таким образом, чтобы был получен смешанный звуковой сигнал;
[0038] блок обработки, сконфигурированный для идентификации количества источников звука и информации о положении каждого источника звука и выделения объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и
[0039] блок объединения, сконфигурированный для объединения информации о положении и объектного звукового сигнала отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала.
[0040] Дополнительно, блок обработки включает в себя:
[0041] субблок обработки, сконфигурированный для идентификации количества источников звука и информации о положении каждого источника звука и выделения объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала, в соответствии с разностью амплитуд и разностью фаз, образованными среди соответствующих микрофонов звуковым сигналом, излучаемым каждым источником звука.
[0042] Дополнительно, блок обработки включает в себя:
[0043] субблок идентификации, сконфигурированный для идентификации количества источников звука и информации о положении каждого источника звука из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и
[0044] субблок выделения, сконфигурированный для выделения объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом, установленной информацией о положении каждого микрофона, количеством источников звука и информацией о положении источников звука.
[0045] Дополнительно, субблок выделения включает в себя:
[0046] модуль создания модели, сконфигурированный для создания соответствующей статистической модели в соответствии с характеристическим показателем, сформированным звуковым сигналом, излучаемым каждым источником звука в предварительно заданном направлении; и
[0047] модуль выделения, сконфигурированный для идентификации и выделения звукового сигнала, соответствующего информации о положении любого источника звука в смешанном звуковом сигнале посредством статистической модели, как объектного звукового сигнала, соответствующего любому источнику звука.
[0048] Дополнительно, блок объединения включает в себя:
[0049] субблок объединения сигналов, сконфигурированный для объединения соответствующих объектных звуковых сигналов согласно порядку размещения отдельных источников звука таким образом, чтобы были получены аудиоданные множественных объектов;
[0050] субблок объединения положений, сконфигурированный для объединения информации о положении отдельных источников звука в соответствии с порядком размещения таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала; и
[0051] первый субблок объединения, сконфигурированный для объединения информации файла заголовка, содержащей предварительно установленный параметр, аудиоданных множественных объектов и вспомогательных данных объектного аудиосигнала в порядке их поступления, таким образом, чтобы были получены аудиоданные в формате объектного аудиосигнала.
[0052] Дополнительно, блок объединения включает в себя:
[0053] субблок отправки файлов заголовков, сконфигурированный для составления информации файла заголовка, содержащей предварительно установленный параметр, и отправки ее на предварительно настроенную аппаратуру для обработки аудиосигналов, при этом информация файла заголовка включает в себя продолжительность времени каждого фрейма аудиоданных, таким образом, что субблок объединения сигналов, субблок объединения положений и второй субблок объединения составляют каждый фрейм аудиоданных в формате объектного аудиосигнала, соответствующем продолжительности каждого фрейма аудиоданных;
[0054] субблок объединения сигналов, сконфигурированный для объединения соответствующих объектных звуковых сигналов согласно порядку размещения отдельных источников звука таким образом, чтобы были получены аудиоданные множественных объектов;
[0055] субблок объединения положений, сконфигурированный для объединения информации о положении отдельных источников звука в соответствии с порядком размещения таким образом, чтобы были получены вспомогательные данные объектного аудиосигнала;
[0056] второй субблок объединения, сконфигурированный для объединения аудиоданных множественных объектов и вспомогательных данных объектного аудиосигнала в порядке их поступления, таким образом, чтобы был получен каждый фрейм аудиоданных в формате объектного аудиосигнала; и
[0057] субблок отправки аудиоданных, сконфигурированный для отправки каждого фрейма аудиоданных в формате объектного аудиосигнала на предварительно настроенную аппаратуру для обработки аудиосигналов.
[0058] Дополнительно, субблок объединения сигналов включает в себя:
[0059] модуль дискретизации сигналов, сконфигурированный для
дискретизации объектных звуковых сигналов, соответствующих отдельным источникам звука, соответственно, в каждый момент времени дискретизации, согласно предварительно установленной частоте дискретизации, и компоновка всех дискретизированных сигналов в соответствии с порядком компоновки, таким образом, чтобы был получен объединенный дискретизированный сигнал; и
[0060] модуль компоновки сигналов, сконфигурированный для компоновки объединенных дискретизированных сигналов, получаемых в каждый момент времени дискретизации поочередно, в порядке дискретизации, таким образом, чтобы были получены аудиоданные множественных объектов.
[0061] Дополнительно, субблок объединения положений включает в себя:
[0062] первый модуль записи положения, сконфигурированный для дискретизации информации о положении, соответствующей отдельным источникам звука, в каждый момент времени дискретизации время выборки интервал дискретизации по времени, согласно предварительно установленной частоте дискретизации, и записи каждой дискретизированной информации о положении в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации, таким образом, чтобы была получена объединенная дискретизированная информация о положении; и
[0063] модуль компоновки положений, сконфигурированный для компоновки объединенной дискретизированной информации о положении, получаемой в каждый момент времени дискретизации поочередно, в соответствии с порядком дискретизации, таким образом, чтобы были получены вспомогательные аудиоданные.
[0064] Дополнительно, субблок объединения положений включает в себя:
[0065] модуль дискретизации положения, сконфигурированный для дискретизации информации о положении, соответствующей отдельным источникам звука, согласно предварительно установленной частоте дискретизации;
[0066] второй модуль записи положения, сконфигурированный для записи каждой полученной дискретизированной информации о положении в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации, если текущая точка дискретизации является первым моментом времени дискретизации, и для сравнения полученной дискретизированной информации о положении каждого источника звука с записанной ранее прежней дискретизированной информацией о положении того же самого источника звука, если текущая точка дискретизации не является первым моментом времени дискретизации, и для записи дискретизированной информации о положении в сочетании с информацией о соответствующем источнике звука и информацией о моменте времени дискретизации при определении путем сравнения, что они различны.
[0067] В соответствии с третьим аспектом осуществления данного изобретения, заявлена электронная аппаратура, включающая в себя:
[0068] процессор; и
[0069] запоминающее устройство для хранения команд, выполняемых процессором;
[0070] при этом процессор сконфигурирован для:
[0071] выполнения операции сбора звуков с одновременным использованием множества микрофонов, таким образом, чтобы был получен смешанный звуковой сигнал;
[0072] идентификации количества источников звука и информации о положении каждого источника звука и выделения объектного звукового сигнала, соответствующего каждому источнику звука, из смешанного звукового сигнала в соответствии со смешанным звуковым сигналом и установленной информацией о положении каждого микрофона; и
[0073] объединения информации о положении и объектных звуковых сигналов отдельных источников звука для получения аудиоданных в формате объектного аудиосигнала.
[0074] Технические решения, в соответствии с примерами реализации данного изобретения, обеспечивают следующие преимущества:
[0075] Как видно из вышеописанных примеров осуществления изобретения, в настоящем варианте осуществления полученный смешанный звуковой сигнал содержит звуковые сигналы, собранные соответствующими микрофонами путем установки множества микрофонов и одновременного выполнения сбора звуков; при этом, за счет объединения установленной информации о положении среди соответствующих микрофонов, каждый источник звука идентифицируется и соответствующий объектный звуковой сигнал выделяется без отдельного сбора звукового сигнала каждого источника звука, что снижает зависимость и требования к аппаратным средствам, и можно непосредственно получить аудиоданные в формате объектного аудиосигнала.
[0076] Следует понимать, что как вышеизложенное общее описание, так и последующее детальное описание являются всего лишь иллюстративными и поясняющими, и не ограничивают объем изобретения, как оно заявлено
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0077] Чертежи, которые включены в настоящую спецификацию и составляют ее часть, иллюстрируют варианты осуществления изобретения и, вместе с описанием, служат для разъяснения принципов изобретения.
[0078] Фиг. 1 представляет собой схематическое изображение получения объектного аудиосигнала известного из уровня техники.
[0079] Фиг. 2 представляет собой другое схематическое изображение получения объектного аудиосигнала известного из уровня техники.
[0080] Фиг. 3 представляет собой блок-схему способа записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0081] Фиг. 4 представляет собой блок-схему другого способа записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0082] Фиг. 5 представляет собой схематическое изображение сбора сигнала от источника звука, в соответствии с примером осуществления данного изобретения.
[0083] Фиг. 6 представляет собой блок-схему еще одного способа записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0084] Фиг. 7 представляет собой схематическое изображение структуры фрейма объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0085] Фиг. 8 представляет собой схематическое изображение другой структуры фрейма объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0086] Фиг. 9 представляет собой схематическое изображение еще одной структуры фрейма объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0087] Фиг. 10 - Фиг. 18 представляют собой блок-схемы, иллюстрирующие устройство для записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
[0088] Фиг. 19 представляет собой структурную блок-схему, иллюстрирующую устройство для записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения.
ПОДРОБНОЕ ОПИСАНИЕ
[0089] Далее приведено подробное описание примеров осуществления изобретения, проиллюстрированных на чертежах. Приведенное ниже описание относится к чертежам, на которых одни и те же номера на различных чертежах представляют одни и те же или похожие элементы, если на них не представлено иное. Варианты осуществления, представленные в последующем описании примеров осуществления, не представляют всех вариантов осуществления, соответствующих данному изобретению. Они являются всего лишь примерами устройств и способов, соответствующих аспектам изобретения, как изложено в прилагаемых пунктах формулы изобретения.
[0090] В соответствующей области техники невозможно получить объектный аудиосигнал с помощью прямой записи. Для удобства понимания ниже проиллюстрированы обычные режимы обработки известного из уровня техники.
[0091] Фиг. 1 представляет собой схематическое изображение получения объектного аудиосигнала известного из уровня техники. Как показано на Фиг. 1, при осуществлении данного процесса необходимо заранее подготовить множество монофонических аудиоустройств, таких, как аудиоустройство канала I, аудиоустройство канала II и аудиоустройство канала III, изображенные на Фиг. 1. В то же время, необходимо заранее подготовить информацию о положении, соответствующую каждому монофоническому аудиоустройству, таком как положение I, соответствующее аудиоустройству канала I; положение II, соответствующее аудиоустройству канала II; и положение III, соответствующее аудиоустройству канала III. Наконец, аудиоустройство каждого звукового канала объединяется с соответствующим положением посредством аппаратуры, создающей объектный аудиосигнал, таким образом, чтобы получить объектный аудиосигнал.
[0092] Однако в режиме обработки, проиллюстрированном на Фиг. 1, имеются следующие недостатки.
[0093] 1) Аудиоданные и информация о положении должны быть подготовлены заранее, поэтому объектный аудиосигнал невозможно получить с помощью прямой записи.
[0094] 2) В то же время, положения соответствующих аудиоустройств звуковых каналов готовят и получают независимо, поэтому реальное положение аудиоустройства каждого звукового канала часто не может быть отражено точно.
[0095] Фиг. 2 представляет собой другое схематическое изображение получения объектного аудиосигнала, известного из уровня техники. Как показано на Фиг. 2, соответствующий микрофон (MIC) подготовлен для каждого источника звука, например, источник звука I соответствует MIC1, источник звука II - MIC2, а источник звука III - MIC3. Каждый микрофон собирает сигналы только от соответствующего источника звука и получает соответствующий объектный звуковой сигнал I, объектный звуковой сигнал II и объектный звуковой сигнал III. В то же время, информация о положении каждого источника звука должна быть подготовлена заранее. Наконец, звуковые сигналы объектов и информация о положении, соответствующая отдельным источникам звука, объединяются посредством аппаратуры, создающей объектные аудиосигналы, таким образом, чтобы были получены аудиосигналы объектов.
[0096] Однако в режиме обработки, проиллюстрированном на Фиг. 2, имеются следующие недостатки.
[0097] 1) Каждый источник звука должен быть оборудован отдельным микрофоном, что повышает стоимость аппаратных средств.
[0098] 2) Поскольку микрофон должен располагаться близко к источнику звука и перемещаться вместе с источником звука, реализация такого режима является очень сложной, и стоимость записывающего оборудования значительно возрастает.
[0099] 3) Между объектными звуковыми сигналами, соответственно,
собираемыми множеством микрофонов, должна поддерживаться синхронизация; при условиях, когда количество источников звука велико, а микрофон расположен поблизости от источника звука и в удалении от аппаратуры, создающей объектный аудиосигнал, или когда используются беспроводные микрофоны, осуществление данного режима весьма затруднено.
[00100] 4) Поскольку информация о положении источника звука получается по отдельности и затем позднее добавляется в объектный аудиосигнал, под влиянием относительно большего количества источников звука и нерегулярного перемещения, полученный в итоге объектный аудиосигнал едва ли будет верно отражать фактическое положение источника звука.
[00101] Таким образом, данное изобретение предоставляет технические решения осуществления записи объектного аудиосигнала, и может решить вышеперечисленные технические проблемы, существующие в соответствующей области техники.
[00102] Фиг. 3 представляет собой блок-схему способа записи объектного аудиосигнала в соответствии с примером осуществления. Как показано на Фиг. 3, данный способ применим в записывающей аппаратуре, и может включать в себя следующие шаги.
[00103] При выполнении шага 302 получается смешанный звуковой сигнал путем выполнения операции сбора звуков посредством множества микрофонов, используемых одновременно.
[00104] При выполнении шага 304 идентифицируются количество источников звука и информация о положении каждого источника звука, и объектный звуковой сигнал, соответствующий каждому источнику звука, выделяется из смешанного звукового сигнала в соответствии с данным сигналом и установленной информацией о положении каждого микрофона.
[00105] В качестве иллюстративного варианта осуществления, могут быть идентифицированы количество источников звука и информация о положении каждого источника звука, и объектный звуковой сигнал, соответствующий каждому источнику звука, может быть выделен из смешанного звукового сигнала непосредственно, в соответствии с характеристической информацией, такой как разность амплитуд и разность фаз, образованные среди соответствующих микрофонов звуковым сигналом, излучаемым каждым источником звука.
[00106] В качестве другого иллюстративного осуществления, количество источников звука и информация о положении каждого источника звука может быть сначала идентифицировано из смешанного звукового сигнала в соответствии с характеристической информацией, такой как вышеупомянутые разность амплитуд и разность фаз, основанные на смешанном звуковом сигнале, и установленной информацией о положении каждого микрофона; после чего объектный звуковой сигнал, соответствующий каждому источнику звука, может быть выделен из смешанного звукового сигнала, в соответствии с характеристической информацией, такой как вышеупомянутые разность амплитуд и разность фаз, на основании смешанного звукового сигнала и установленной информации о положении каждого микрофона.
[00107] При выполнении шага 306 информация о положении каждого источника звука и объектный звуковой сигнал объединяются для получения аудиоданных в формате объектного аудиосигнала.
[00108] В данном варианте осуществления объектный аудиосигнал может относиться к звуковому формату для Audio Object (аудиообъекта) в целом, при этом в качестве аудиообъекта может быть использован точечный источник звука, содержащий информацию о положении, или поверхностный источник звука, центральное положение которого может быть оценено приблизительно.
[00109] В данном варианте осуществлении объектный аудиосигнал включает в себя две части: часть источника звука и объектного звукового сигнала, при этом объектный звуковой сигнал сам по себе может рассматриваться как монофонический аудиосигнал; форма объектного звукового сигнала может представлять собой несжатый формат, такой как ИКМ (импульсно-кодовая манипуляция) и ПЦП (прямой цифровой поток), или сжатый формат, такой как МР3 (MPEG-1 или MPEG-2 аудиослой III), ААС (усовершенствованное звуковой кодирование) и Dolby Digital (цифровой формат 5.1-канальной дискретной стереофонической записи звука), что данным изобретением не ограничивается.
[00110] Как видно из вышеописанных примеров осуществления изобретения, в настоящем варианте осуществления полученный смешанный звуковой сигнал содержит звуковые сигналы, собранные соответствующими микрофонами путем установки множества микрофонов и одновременного выполнения сбора звуков; при этом, за счет объединения установленной информации о положении среди соответствующих микрофонов, каждый источник звука идентифицируется, и соответствующий объектный звуковой сигнал выделяется без отдельного сбора звукового сигнала каждого источника звука, что снижает зависимость и требования к аппаратным средствам, и можно непосредственно получить аудиоданные в формате объектного аудиосигнала.
[00111] Фиг. 4 представляет собой блок-схему другого способа записи объектного аудиосигнала в соответствии с примером осуществления данного изобретения. Как показано на Фиг. 4, данный способ может включать в себя следующие шаги.
[00112] При выполнении шага 402 получается смешанный звуковой сигнал путем выполнения сбора звука с использованием множества микрофонов одновременно.
[00113] В данном варианте осуществлении изобретения, если количество микрофонов равно двум, операция записи объектного аудиосигнала может выполняться на множестве источников звука в одной и той же плоскости; а если количество микрофонов равно трем или более, операция записи объектного аудиосигнала может выполняться на множестве источников звука в любом трехмерном пространстве. Для одной и той же настройки источников звука, чем больше имеется микрофонов, тем больший вклад они будут вносить в идентификацию количества и информации о положении источников звука, а также в выделение объектного звукового сигнала каждого источника звука.
[00114] При выполнении шага 404 получают состояние положения каждого микрофона.
[00115] В данном варианте осуществлении изобретения, как показано на Фиг. 5, во время записи объектного аудиосигнала каждым из микрофонов состояние положения остается неизменным. Даже в случае изменения информации о положении источника звука микрофон не требует изменения состояния своего положения, поскольку изменение положения может быть осуществлено в собранном смешанном звуковом сигнале и может быть идентифицировано в последующих шагах. В то же время, взаимно однозначное соответствие между микрофонами и источниками звука отсутствует; независимо от количества источников звука, сбор звуковых сигналов может выполняться посредством, по меньшей мере, двух микрофонов, и могут быть получены соответствующие смешанные звуковые сигналы.
[00116] Поэтому, по сравнению с примерами осуществления, показанными на Фиг. 1 и Фиг. 2, в данном примере осуществления может быть идентифицировано фактическое положение каждого источника звука четко и точно, без большого количества микрофонов и без синхронного перемещения микрофона вместе с источником звука, что помогает снизить стоимость аппаратных средств и сложность системы, а также повысить качество объектного аудиосигнала.
[00117] В данном варианте осуществления изобретения состояние положения микрофона включает в себя установленную информацию о положении микрофона. Состояние положения каждого микрофона может регистрироваться с использованием координат, например, пространственных координат любого положения (такого как положение аудитории) в качестве начала координат, при этом такими пространственными координатами могут быть прямоугольные координаты (O-xyz) или сферические координаты (O-θγr), и соотношение преобразования между этими двумя координатами имеет следующий вид:
[00118]
[00119] при этом координаты х, y, и z, соответственно, указывают координаты положения микрофона или источника звука (объекта) по оси х (направление вперед и назад), по оси у (направление слева направо), и по оси z (направление сверху вниз) в прямоугольных координатах; и θ, γ, и z, соответственно, указывают горизонтальный угол (угол между проекцией линии, соединяющей микрофон или источник звука и начало координат в горизонтальной плоскости и по оси х), вертикальный угол (угол между линией, соединяющей микрофон или источник звука и начало координат, и горизонтальную плоскость) микрофона или источника звука, и расстояние от микрофона или источника до начала координат по прямой линии в сферических координатах.
[00120] Очевидно, что состояние положения каждого микрофона может быть записано отдельно; или может быть записано состояние относительных положений среди соответствующих микрофонов, и из них можно вывести состояние индивидуального положения каждого микрофона.
[00121] При выполнении шага 406, в соответствии с положением каждого микрофона, идентифицируют источник звука из смешанного звукового сигнала, и получают количество источников звука и информация о положении каждого источника звука.
[00122] В качестве примера осуществления изобретения, количество источников звука и информация о положении каждого источника звука могут быть идентифицированы на основании разности амплитуд и разности фаз, образованных среди соответствующих микрофонов звуковым сигналом, излучаемым каждым источником звука. В данном примере осуществления изобретения соответствующая разность фаз может быть реализована разностью между моментами времени, когда звуковой сигнал, излучаемый каждым источником звука, поступает на соответствующие микрофоны.
[00123] На практике все технические решения идентификации источника звука (определение, существует ли источник звука) и идентификации количества источников звука и информации о положении, основанные на разности амплитуд и разности фаз, известные в соответствующей области техники, могут применяться в процессе выполнения шага 406, такие, как метод MUSIC (классификация множественных сигналов), лучеобразующий метод, и метод CSP (фазы спектра перекрестной мощности).
[00124] Очевидно, что в соответствующей области техники существуют и другие алгоритмы идентификации количества источников звука, информации о положении на основании разности амплитуд и разность фаз, а также алгоритмы, основанные на других принципах для идентификации количества источников звука и информации о положении, все из которых могут применяться в примерах осуществления данного изобретения, и которые не ограничиваются данным изобрете