Система генерирования статистической информации и способ генерирования статистической информации
Иллюстрации
Показать всеИзобретение относится к компьютерной технике, а именно к генерированию статистической информации. Технический результат - возможность скрытия идентификационных данных личности в статистических данных в случае использования данных о местоположении, полученных при помощи телефонной сети. Система генерирования статистической информации включает в себя секцию ввода условия, секцию извлечения, которая извлекает неидентифицируемые данные о местоположении и неидентифицируемые атрибутивные данные, секцию добавления коэффициента увеличения, которая добавляет коэффициент увеличения к неидентифицируемым атрибутивным данным, секцию статистики, которая вычисляет статистические данные посредством использования неидентифицируемых данных о местоположении, неидентифицируемых атрибутивных данных и коэффициента увеличения, секцию подсчета, которая подсчитывает неидентифицируемые данные о местоположении, секцию определения, которая определяет величину количества порций данных, и секцию вывода, которая скрывает статистические данные для вывода статистических данных. 3 н. и 6 з.п. ф-лы, 10 ил.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к системе генерирования статистической информации и способу генерирования статистической информации.
Уровень техники
Известно устройство для получения информации о местоположении портативного терминала и анализа распределения населения пользователей портативного терминала на основе информации о местоположении (см. патентную литературу 1 и 2). Посредством использования информации о местоположении портативного терминала таким образом, в отличие от случая использования демографических данных, полученных посредством переписи населения и т.п., также может быть получено распределение населения, отражающее тенденцию передвижения пользователей.
Например, устройство, описанное в патентной литературе 1, вычисляет распределение населения, соответствующее целевым областям и демографическим характеристикам целевой группы посредством использования базы данных, которая хранит информацию о местоположении каждого портативного терминала. Кроме того, устройство, описанное в патентной литературе 2, генерирует итоговый результат ответных сигналов терминалов, которые принимают сигнал подтверждения терминала для каждой базовой станции, в качестве информации о плотности населения.
Такая традиционная статистическая обработка распределения населения использует рабочие данные, такие как данные о местоположении портативного терминала и атрибутивные данные пользователя, в качестве данных для предложения услуги связи пользователю портативного терминала. Посредством применения статистической обработки, такой как подсчет рабочих данных, может быть получено оценочное значение, связанное с передвижением населения, включающее в себя «распределение населения», «количество передвигающихся людей» и «состав населения». В данном случае «распределение населения» означает количество населения, распределенное в каждой области, «количество движущихся людей» означает количество людей, передвигающихся между областями, и «состав населения» означает распределение населения и количество движущихся людей, которые разделены по полу, возрастной категории.
Список ссылок
Патентная литература
[Патентная литература 1] Опубликованная заявка на патент Японии № 2003-30373.
[Патентная литература 2] Опубликованная заявка на патент Японии № 2005-286657.
Сущность изобретения
Техническая проблема
Однако в вышеупомянутой традиционной статистической обработке, так как все люди, подлежащие подсчету, не имеют своих собственных портативных терминалов, точное передвижение населения не может быть получено простым суммированием данных о местоположении портативных терминалов. Чтобы получить точное передвижение населения, например, посредством умножения данных о местоположении, полученных от портативных терминалов, на обратную величину соотношения абонентов для каждого атрибута абонентов портативных терминалов для вычисления взвешенной суммы, необходимо оценить все население, включая в подсчет людей, не имеющих портативные терминалы.
Соответственно, при попытке оценить передвижение населения в соответствии с традиционной технологией статистической обработки, имеет место следующая проблема. В частности, это проблема скрытия. Когда выполняется статистическая обработка, информация об индивидуальных портативных терминалах теряется и только статистическая тенденция группы представлена в итоговом результате. Однако, когда итоговая информация генерируется в слишком маленьком итоговом диапазоне во время хода статистической обработки, в статистических данных могут появиться идентификационные данные личности. С другой стороны, когда итоговая информация генерируется в излишне приблизительном итоговом диапазоне, ухудшается практичность оценочных данных. Чтобы решить эту проблему, при традиционной статистической обработке данных об обществе результирующие статистические данные могут подвергаться обработке, называемой «обработкой скрытия». То есть, если значение в итоговой таблице падает ниже некоторого значения (упоминаемого как эталонный уровень скрытия), итоговый результат не отображается или отображается как ноль. Однако, как описано выше, при оценке населения с использованием данных о местоположении от сети мобильной телефонной связи, так как находится взвешенная сумма, полученная посредством умножения данных на разные весовые коэффициенты для разных атрибутов абонентов, необходимость или отсутствие необходимости скрытия не может быть определена просто посредством сравнения оценочного значения с эталонным уровнем скрытия по величине.
Поэтому настоящее изобретение выполнено с учетом такой проблемы и его задачей является обеспечение системы генерирования статистической информации и способа генерирования статистической информации, которые могут скрывать идентификационные данные личности в статистических данных в случае использования данных о местоположении, полученных при помощи мобильной телефонной сети.
Решение проблемы
Для решения вышеупомянутой проблемы система генерирования статистической информации настоящего изобретения включает в себя: первое средство ввода, которое вводит данные, хранящие информацию о местоположении, включающие в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении; второе средство ввода, которое вводит данные, хранящие атрибутивную информацию, включающие в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи; средство ввода условия, которое вводит информацию условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию; средство извлечения, которое извлекает часть данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска; средство добавления коэффициента увеличения, которое добавляет к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициент увеличения, соответствующий атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающий степень увеличения до значения статистической цели; средство статистики, которое вычисляет и выводит статистические данные по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию; средство подсчета, которое подсчитывает количество порций данных, хранящих информацию о местоположении, извлеченных средством извлечения; средство определения, которое определяет величину количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и средство вывода, которое выводит статистические данные, когда средство определения определяет, что количество порций данных является большим, и скрывает значение, включенное в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
Альтернативно способ генерирования статистической информации настоящего изобретения включает в себя: первый этап ввода в первом средстве ввода для ввода данных, хранящих информацию о местоположении, включающих в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении; второй этап ввода во втором средстве ввода для ввода данных, хранящих атрибутивную информацию, включающих в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи; этап ввода условия в средстве ввода условия для ввода информации условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию; этап извлечения в средстве извлечения для извлечения части данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска; этап добавления коэффициента увеличения в средстве добавления коэффициента увеличения для добавления к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициента увеличения, соответствующего атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающего степень увеличения до значения статистической цели; этап статистики в средстве статистики для вычисления и вывода статистических данных по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию; этап подсчета в средстве подсчета для подсчета количества порций данных, хранящих информацию о местоположении, извлеченных средством извлечения; этап определения в средстве определения для определения величины количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и этап вывода в средстве вывода для вывода статистических данных, когда средство определения определяет, что количество порций данных является большим, и скрытия значения, включенного в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
Согласно такой системе генерирования статистической информации или способу генерирования статистической информации демографические данные, учитывающие степень увеличения до значения статистической цели, вычисляются из данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе условия поиска. Кроме того, информация в качестве сведений для определения необходимости или отсутствия необходимости скрытия статистических данных обеспечивается посредством подсчета оценочных данных в качестве оценочного значения населения, учитывая соотношение абонентов портативного терминала в соответствии с атрибутом, а также количества порций данных в качестве действительного количества порций данных о местоположении, используемых для генерирования оценочных данных.
Кроме того, определяется, генерируются ли или нет оценочные статистические данные из «малой группы» на основе вышеупомянутого количества порций данных, и статистические данные скрываются на основе результата определения. Генерируются ли или нет оценочные статистические данные из «малой группы», не может быть определено только на основе статистического показателя в статистических данных. Это происходит вследствие того, что статистический показатель выводится в соответствии с расширенной оценкой, основанной на соотношении абонентов портативного терминала, которое меняется в соответствии с атрибутом. Таким образом, посредством использования подсчитанного количества порций данных может точно определяться, генерируются ли или нет подсчитанные данные из «малой группы».
В результате могут быть скрыты идентификационные данные личности в статистических данных, оцененных на основе данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию.
Полезные эффекты изобретения
Согласно настоящему изобретению в случае использования данных о местоположении, полученных посредством сети мобильной телефонной связи, могут быть скрыты идентификационные данные личности в статистических данных.
Краткое описание чертежей
Фиг.1 представляет собой схематический вид конфигурации, изображающий систему генерирования статистической информации согласно одному предпочтительному варианту осуществления настоящего изобретения.
Фиг.2 представляет собой вид, изображающий структуру данных для данных, хранящих информацию о местоположении, введенных в первую секцию ввода на фиг.1.
Фиг.3 представляет собой вид, изображающий структуру данных для данных, хранящих атрибутивную информацию, введенную во вторую секцию ввода на фиг.1.
Фиг.4 представляет собой блок-схему последовательности операций, изображающую операции системы генерирования статистической информации на фиг.1.
Фиг.5 представляет собой вид для объяснения принципа оценки количества терминалов в данном варианте осуществления.
Фиг.6 представляет собой вид для объяснения способа вычисления в соответствии с оценкой количества терминалов в данном варианте осуществления.
Фиг.7 представляет собой блок-схему последовательности операций, изображающую обработку оценки количества посещающих терминалов в данном варианте осуществления.
Фиг.8 представляет собой вид для объяснения способа вычисления оценочного периода пребывания в данном варианте осуществления.
Фиг.9 представляет собой вид для объяснения способа извлечения данных о местоположении в данном варианте осуществления.
Фиг.10 представляет собой блок-схему последовательности операций, изображающую пример обработки скрытия в данном варианте осуществления.
Описание вариантов осуществления
Ниже подробно описывается предпочтительный вариант осуществления системы генерирования статистической информации и способа генерирования статистической информации согласно настоящему изобретению со ссылкой на фигуры. Следует отметить, что в описании фигур одинаковым компонентам присвоены одинаковые ссылочные позиции и излишнее описание опускается.
Фиг.1 представляет собой схематический вид конфигурации, изображающий систему 1 генерирования статистической информации согласно одному предпочтительному варианту осуществления настоящего изобретения. Система 1 генерирования статистической информации, показанная на фиг.1, представляет собой компьютерную систему, которая генерирует статистические данные, включающие в себя оценочное значение передвижения населения посредством использования информации о местоположении в качестве данных для предложения услуги связи терминалам мобильной связи, таким как множество портативных терминалов 2 в сети NW мобильной связи. Система 1 генерирования статистической информации состоит из множества процессоров информации, включающих в себя устройство 11 генерирования неидентифицируемой информации, устройство 21 подсчета и устройство 31 скрытия информации, и позволяет выполнять передачу данных с портативными терминалами 2 и устройствами связи, подсоединенными к сети NW мобильной связи посредством базовой радиостанции 3 и сети NW мобильной связи. Система 1 генерирования статистической информации может включать в себя один процессор информации или может включать в себя любое количество процессоров информации.
Каждый портативный терминал 2, описанный выше, имеет функцию получения информации о своем местоположении в соответствии с различными системами операции позиционирования, такими как позиционирование посредством использования GPS и позиционирования посредством использования электрических волн от базовой радиостанции 3. Кроме того, информация о местоположении портативных терминалов 2, которая получается в результате операции позиционирования, является передаваемой с портативных терминалов 2 и устройств связи, подсоединенных к сети NW мобильной связи, на систему 1 генерирования статистической информации.
Ниже подробно описывается конфигурация системы 1 генерирования статистической информации.
Устройство 11 генерирования неидентифицируемой информации включает в себя первую секцию 12 ввода (первое средство ввода), вторую секцию 13 ввода (второе средство ввода), секцию 14 управления ключом (средство управления ключом), секцию 15 одностороннего действия (средство одностороннего действия), секцию 16 генерирования неидентифицируемых данных о местоположении (средство генерирования неидентифицируемых данных о местоположении) и секцию 17 генерирования неидентифицируемых атрибутивных данных (средство генерирования неидентифицируемых атрибутивных данных).
Первая секция 12 ввода принимает информацию о местоположении извне, например от сети NW мобильной связи, и сохраняет ее в данных, хранящих информацию о местоположении. Как показано на фиг.2, данные, хранящие информацию о местоположении, включают в себя: первую идентификационную информацию «090-ХХХХ-ХХХХ» в качестве информации для идентификации портативного терминала 2, например телефонный номер; информацию «X1 и Y1» о местоположении в качестве информации, относящейся к местоположению портативного терминала 2, например информации о широте и долготе или идентификационной информации базовой радиостанции 3, которая принимает сигнал регистрации местоположения портативного терминала 2; и время «2010/5/30 12:24», когда получается информация о местоположении. Кроме того, первая секция 12 ввода выводит хранимые данные, хранящие информацию о местоположении, на секцию 16 генерирования неидентифицируемых данных о местоположении.
Вторая секция 13 ввода принимает атрибутивные данные, указывающие атрибут портативного терминала 2, извне, например от сети NW мобильной связи, и сохраняет их в данных, хранящих атрибутивную информацию. Как показано на фиг.3, данные, хранящие атрибутивную информацию, включают в себя вторую идентификационную информацию «090-ХХХХ-ХХХХ» в качестве информации для идентификации портативного терминала 2, например телефонного номера, и атрибутивную информацию, указывающую атрибут абонента портативного терминала 2, идентифицированного на основе второй идентификационной информации, т.е. когда второй идентификационной информацией является телефонный номер, атрибут абонента этого телефона. Конкретные примеры такой атрибутивной информации включают в себя адрес «Tokyo, Shinjuku-ku», пол «мужской», возраст «тридцатилетние» в качестве типовых примеров. Следует отметить, что для этого же портативного терминала 2 первая идентификационная информация имеет такое же значение данных, что и вторая идентификационная информация. Кроме того, вторая секция 13 ввода выводит хранимые данные, хранящие атрибутивную информацию, на секцию 17 генерирования неидентифицируемых атрибутивных данных.
Ссылаясь снова на фиг.1, секция 14 управления ключом хранит предварительно определенную информацию электронного ключа. Желательно, чтобы информация электронного ключа управлялась строго, чтобы предотвратить утечку из средства управления ключом.
Секция 15 одностороннего действия принимает первую идентификационную информацию и вторую идентификационную информацию от секции 16 генерирования неидентифицируемых данных о местоположении и секции 17 генерирования неидентифицируемых атрибутивных данных соответственно и применяет одностороннюю функцию к каждой из первой идентификационной информации и второй идентификационной информации на основе информации электронного ключа, содержащейся в секции 14 управления ключом, для вывода первой неидентифицируемой информации и второй неидентифицируемой информации соответственно. Например, секция 15 одностороннего действия использует хеш-функцию, такую как SHA (алгоритм безопасного хеширования)-256 в качестве односторонней функции и выполняет операцию вывода хеш-значения соединения первой идентификационной информации или второй идентификационной информации и информации ключа, таким образом выводя первую неидентифицируемую информацию или вторую неидентифицируемую информацию.
Секция 16 генерирования неидентифицируемых данных о местоположении добавляет первую неидентифицируемую информацию, созданную посредством удаления первой идентификационной информации из данных, хранящих информацию о местоположении, и ввода первой идентификационной информации в секцию 15 одностороннего действия, к данным, хранящим информацию о местоположении, таким образом генерируя данные, хранящие неидентифицируемую информацию о местоположении. В данном случае является предпочтительным, что секция 16 генерирования неидентифицируемых данных о местоположении выполняет дополнительную обработку данных, например добавляет подходящий шум к информации о местоположении для сдвига местоположения. Кроме того, секция 16 генерирования неидентифицируемых данных о местоположении передает сгенерированные данные, хранящие неидентифицируемую информацию о местоположении, на устройство 21 подсчета.
Секция 17 генерирования неидентифицируемых атрибутивных данных добавляет вторую неидентифицируемую информацию, созданную посредством удаления второй идентификационной информации из данных, хранящих атрибутивную информацию, и ввода второй идентификационной информации в секцию 15 одностороннего действия, к данным, хранящим атрибутивную информацию, таким образом генерируя данные, хранящие неидентифицируемую атрибутивную информацию. В данном случае является предпочтительным, что секция 17 генерирования неидентифицируемых атрибутивных данных генерирует атрибутивную информацию абстрагирования, полученную посредством абстрагирования атрибутивной информации, и заменяет атрибутивную информацию атрибутивной информацией абстрагирования. Примеры такой обработки абстрагирования включают в себя округление «возраста» до «возрастной категории», удаление подробностей адреса и удаление информации, включающей в себя идентификационные данные личности, такие как имена. Кроме того, секция 17 генерирования неидентифицируемых атрибутивных данных передает сгенерированные данные, хранящие неидентифицируемую атрибутивную информацию, на устройство 21 подсчета.
Устройство 21 подсчета системы 1 генерирования статистической информации включает в себя секцию 22 хранения, секцию 23 ввода условия (средство ввода условия), секцию 24 извлечения (средство извлечения), секцию 25 добавления коэффициента увеличения (средство добавления коэффициента увеличения), секцию 26 статистики (средство статистики) и секцию 27 подсчета (средство подсчета).
Секция 22 хранения хранит данные, хранящие неидентифицируемую информацию о местоположении, и данные, хранящие неидентифицируемую атрибутивную информацию, которые генерируются устройством 11 генерирования неидентифицируемой информации.
Секция 23 ввода условия принимает ввод условия поиска для данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, от запросчика статистической обработки. Условие поиска может вводиться непосредственно в систему 1 генерирования статистической информации или может приниматься посредством сети связи, такой как сеть NW мобильной связи. Например, когда запросчик пытается оценить «количество мужчин, которые присутствуют в области А в момент времени t», секция 23 ввода условия принимает ввод информации, соответствующей «момент времени = t, информация о местоположении ∈ области A, пол = мужской», в качестве условия поиска. Кроме того, секция 23 ввода условия передает принятое условие поиска на секцию 24 извлечения.
Секция 24 извлечения извлекает некоторые наборы данных, соответствующие условию поиска, переданные от секции 23 ввода условия, из данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, хранимых в секции 22 хранения. Например, когда задается вышеупомянутое условие поиска, секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, которые соответствуют «момент времени = t, информация о местоположении ∈ области А», и набор данных, хранящих неидентифицируемую атрибутивную информацию, которые соответствуют «пол = мужской». Затем секция 24 извлечения выполняет операцию соединения в реляционной алгебре над соответствующими извлеченными наборами данных посредством использования первой неидентифицируемой информации и второй неидентифицируемой информации в качестве информации ключа. Таким образом, может быть получен набор данных, который получается посредством соединения информации о местоположении и атрибутивной информации, которая соответствует «момент времени = t, информация о местоположении ∈ области А, пол = мужской».
В данном случае, когда степень соответствия условию поиска получается как значение вероятности в результате сравнения условия поиска с данными, хранящими неидентифицируемую информацию о местоположении, секция 24 извлечения может добавить вероятностную информацию, указывающую значение вероятности, к данным, хранящим неидентифицируемую информацию о местоположении. Например, когда задается вероятностно, выполняется ли или нет «информация о местоположении ∈ области А», вероятность может быть добавлена к извлеченным наборам. Когда атрибутивная информация, включенная в данные, хранящие неидентифицируемую атрибутивную информацию, заменяется на атрибутивную информацию абстрагирования, секция 24 извлечения извлекает данные, хранящие неидентифицируемую атрибутивную информацию, посредством сравнения информации о местоположении абстрагирования с условием поиска. Например, когда атрибутивная информация абстрагирования устанавливается на «возраст: пятидесятилетние», определяется, что атрибутивная информация абстрагирования соответствует условию поиска «возраст = двадцатилетние - пятидесятилетние».
Основываясь на атрибутивной информации, включенной в данные, хранящие неидентифицируемую атрибутивную информацию, соединенные с данными, хранящими неидентифицируемую информацию о местоположении, секция 25 добавления коэффициента увеличения получает коэффициент увеличения в качестве числового значения и добавляет коэффициент увеличения к соединенному набору данных в соответствии с предварительно определенной процедурой. Коэффициент увеличения представляет собой коэффициент, указывающий степень увеличения значения населения статистической цели. Например, секция 25 добавления коэффициента увеличения предварительно сохраняет соотношение абонентов мобильного телефона для каждой комбинации возрастной категории и пола, такой как «тридцатилетние, мужской» и «двадцатилетние, женский», и добавляет обратную величину соответствующего соотношения абонентов набору данных, включающему в себя некоторую комбинацию возраста и пола в качестве атрибутивной информации, и выводит ее. Более конкретно, когда соотношение абонентов «тридцатилетние, мужской» удовлетворяется на 50% (=0,5), коэффициент увеличения «2,0» в качестве обратной величины «0,5» выводится в атрибутивную информацию «35 лет, мужской».
Секция 26 статистики вычисляет статистические данные, относящиеся к оценочному населению посредством использования набора данных, полученного посредством соединения данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, которые извлекаются секцией 24 извлечения, друг с другом, и коэффициент увеличения, добавляемый секцией 25 добавления коэффициента увеличения. В частности, секция 26 статистики извлекает возраст и пол из атрибутивной информации для каждой информации, включенной в набор данных, и запрашивает получение секцией 25 добавления коэффициента увеличения соответствующего коэффициента увеличения. Кроме того, секция 26 статистики вычисляет общую сумму коэффициентов увеличения всех записей данных (элементов данных), включенных в набор данных, в качестве оценочного количества людей. В данном случае, когда некоторые записи данных, включенные в набор данных, добавляются с вероятностной информацией, указывающей значение вероятности, соответствующее условию поиска, секция 26 статистики может вычислить статистическое количество людей, беря общую сумму значений, полученных посредством умножения вероятностной информации на коэффициент увеличения. Кроме того, секция 26 статистики также выводит вычисленные статистические данные на устройство 31 скрытия информации.
Секция 27 подсчета подсчитывает количество порций данных записей данных (элементов данных) в наборе данных, извлеченном секцией 24 извлечения, и выводит подсчитанное значение в качестве подсчитанного количества людей на устройство 31 скрытия информации. В данном случае при вычислении подсчитанного количества людей не принимаются во внимание коэффициент увеличения и вероятностная информация. Причина заключается в следующем: так как устройство 31 скрытия информации должно определять необходимость или отсутствие необходимости скрытия статистических данных, основываясь на том, что «информация оценивается из такой группы, сколько пользователей портативных терминалов 2», необходимо исходное количество элементов данных перед обработкой взвешивания, использующей коэффициент увеличения и вероятностную информацию.
Устройство 31 скрытия информации системы 1 генерирования статистической информации включает в себя секцию 32 определения (средство определения) и секцию 33 вывода (средство вывода).
Секция 32 определения сравнивает количество порций данных, подсчитанных секцией 27 подсчета, с предварительно определенным значением для определения величины количества порций данных. Например, когда конкретное эталонное значение предварительно задается как «10», секция 32 определения определяет, равно ли или нет количество людей, которое подсчитано секцией 27 подсчета, «10» или больше. Когда количество людей равно 10 или больше в результате определения, секция 32 определения определяет, что подсчитанное количество людей является большим, и когда количество людей меньше 10, определяет, что подсчитанное количество людей является малым. Затем секция 32 определения передает результат определения на секцию 33 вывода.
Секция 33 вывода принимает решение, выводить ли или нет непосредственно статистические данные, включающие в себя оценочное количество людей, которое оценивается секцией 21 подсчета, на основе результата определения секции 32 определения и выводит окончательные статистические данные. Статистические данные могут выводиться на устройство вывода, такое как устройство отображения, обеспечиваемое непосредственно в системе 1 генерирования статистической информации, или может выводиться на удаленное устройство, такое как портативный терминал 2, посредством сети связи, такой как сеть NW мобильной связи. В частности, когда определяется, что подсчитанное количество людей является большим, секция 33 вывода непосредственно выводит оценочное количество людей, которое включено в статистические данные. С другой стороны, когда определяется, что подсчитанное количество людей является малым, секция 33 вывода заменяет оценочное количество людей предварительно определенным значением или символом и выводит его, таким образом скрывая оценочное количество людей. Например, оценочное количество людей выводится как «0» или заменяется символом «x», представляющим выводимое скрытие. Даже когда определяется, что подсчитанное количество людей является большим, является предпочтительным, что при рассмотрении возможности раскрытия остаточного значения оценочное количество людей округляется до приблизительного значения, имеющего некоторый числовой интервал, или значение, полученное посредством добавления случайного числа, выводится в качестве оценочного значения.
Ниже в данном документе, ссылаясь на фиг.4, описываются операции системы 1 генерирования статистической информации и подробно описывается способ генерирования статистической информации в системе 1 генерирования статистической информации. Фиг.4 представляет собой блок-схему последовательности операций, изображающую операции системы 1 генерирования статистической информации при генерировании статистической информации.
Сначала устройство 11 генерирования неидентифицируемой информации принимает вводы информации о местоположении и сохраняет их в данных, хранящих информацию о местоположении (этап S101). Затем секция 16 генерирования неидентифицируемых данных о местоположении устройства 11 генерирования неидентифицируемой информации удаляет первую идентификационную информацию из данных, хранящих информацию о местоположении, и добавляет первую неидентифицируемую информацию, полученную посредством ввода ее в секцию 15 одностороннего действия, к данным, хранящим информацию о местоположении, таким образом генерирует данные, хранящие неидентифицируемую информацию о местоположении, и сохраняет ее в секции 22 хранения устройства 21 подсчета (этап S102). После этого устройство 11 генерирования неидентифицируемой информации принимает вводы атрибутивной информации и сохраняет их в данных, хранящих атрибутивную информацию (этап S103). Затем секция 17 генерирования неидентифицируемых атрибутивных данных устройства 11 генерирования неидентифицируемой информации удаляет вторую идентификационную информацию из данных, хранящих атрибутивную информацию, и добавляет вторую неидентифицируемую информацию, полученную посредством ввода ее в секцию 15 одностороннего действия, к данным, хранящим атрибутивную информацию, таким образом генерирует данные, хранящие неидентифицируемую атрибутивную информацию, и сохраняет их в секции 22 хранения устройства 21 подсчета (этап S104).
Далее секция 23 ввода условия устройства 21 подсчета принимает ввод условия поиска для задания условия статистической обработки (этап S105). Например, секция 23 ввода условия принимает ввод информации, соответствующий «момент времени = t, информация о местоположении ∈ области A, пол = мужской» в качестве условия поиска для оценки «количества мужчин, которые присутствуют в момент t времени в области A». В ответ на это секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, и набор данных, хранящих неидентифицируемую атрибутивную информацию, которые соответствуют принятому условию поиска, из секции 22 хранения (этап S106). В частности, секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, соответствующих «момент времени = t, информация о местоположении ∈ области A», и набор данных, хранящих неидентифицируемую атрибутивную информацию, соответствующих «пол = мужской», из секции 22 хранения соответственно. Далее секция 24 извлечения выполняет операцию соединения над соответствующими извлеченными наборами посредством использования первой неидентифицируемой информации и второй неидентифицируемой информации в качестве ключей (этап S107). В результате секция 24 извлечения получает набор данных, соответствующий условию поиска.
Затем секция 26 статистики извлекает часть атрибутивной информации, например возраст и пол, из компонентов набора данных, извлеченного секцией 24 извлечения, и предоставляет эту часть секции 25 добавления коэффициента увеличения, таким образом получая коэффициент увеличения для каждого компонента (этап S108). После этого секция 26 статистики вычисляет общую сумму коэффициентов увеличения для получения оценочного количества людей (этап S109). Далее секция 27 подсчета вычисляет количество элементов набора данных, извлеченных секцией 24 извлечения, для получения подсчитанного количества людей (этап S110).
Предполагается, что секция 24 извлечения получает набор данных, состоящий из четырех элементов данных, причем каждый