2.2. Проектирование кодов и классификаторов
статистической информации

Под кодом понимают систему условных обозначений объекта или элементов информационной совокупности в виде знака или группы знаков, выраженных цифрами, буквами и символами.

Процесс присвоения объектам кодовых обозначений называется кодированием. Основная цель кодирования состоит в однозначном обозначении объектов, а также представлении их в компактной форме.

При проектировании кодов к ним предъявляется ряд требований:

  • охват всех объектов, подлежащих кодированию, и возможность их расширения без изменения правил обозначения;
  • удобство восприятия и запоминания кодовых обозначений;
  • максимальная информативность кода при минимальной его значности;
  • возможность автоматического контроля кодовых обозначений с целью обнаружения ошибок.

Разработка кодов состоит из четырех этапов.

На первом этапе определяются объекты (номенклатура), подлежащие кодированию, которыми могут быть министерства и ведомства, номенклатура промышленной и сельскохозяйственной продукции и т.д. Затем по каждой номенклатуре устанавливается полный перечень всех позиций, подлежащих кодированию.

На втором этапе каждая номенклатура систематизируется по определенным классификационным признакам на основе выбранной системы классификации.

Упорядоченное расположение классифицируемых элементов на основе установленных взаимосвязей между признаками составляет систему классификации. В практике проектирования кодовых обозначений применяются две системы классификации: иерархическая и многоаспектная.

По иерархической системе классификации устанавливаются отношения соподчинения между классификационными признаками путем их деления на классы, подклассы, группы, подгруппы и т.д., т.е. осуществляется

26

последовательный переход от общих признаков к детализированным. Достоинство иерархической системы классификации - в простоте построения и ее большой емкости.

Однако такая жесткая структура классификации требует строгой фиксированности признаков и порядка их следования, что исключает возможность группировать объекты по не предусмотренному заранее сочетанию признаков.

В отличие от иерархической многоаспектная (фасетная) система классификации предполагает деление множества объектов одновременно по нескольким независимым признакам без их соподчиненности.

При многоаспектной системе классификации множество объектов классификации может одновременно и независимо друг от друга образовывать исходя из алгоритмов решения задач любое подмножество классификационных признаков (группировок), которые внутри фасетов (наборов признаков) в основном располагаются в виде произвольного перечисления.

При построении многоаспектной системы классификации требуется, чтобы признаки, используемые в различных фасетах, не повторялись. В связи с группировкой признаков в независимые фасеты классификация информации приобретает гибкую блочную структуру, позволяющую вводить новые и исключать старые фасеты. Недостаток такой системы классификации - в сложности построения при чрезмерном увеличении количества признаков классификации.

На третьем этапе на основании проведенной классификации определяют правила обозначения объектов в соответствии с выбранной системой кодирования. Выбор системы кодирования в основном зависит от количества классификационных признаков и структуры их построения.

При проектировании машинной обработки статистической информации широко применяют следующие системы кодирования: порядковую, серийно-порядковую, позиционную (разрядную) и комбинированную.

Порядковая система кодирования заключается в последовательной регистрации объектов только с одним признаком. Для этой системы характерна простота присвоения кодовых обозначений, и ее рекомендуется применять для устойчивых и простых номенклатур.

Серийно-порядковая система применяется для кодирования двух призначных номенклатур, находящихся в определенной соподчиненности. Старшему признаку выделяется серия номеров с учетом возможного расширения позиций объекта, а младшему присваиваются порядковые номера в пределах выделенной серии. В пределах каждой серии предусматриваются резервные номера.

27

В отличие от порядковой системы серийно-порядковый код характеризует определенные свойства объекта, однако он сложен в построении и труднозапоминаем, если им обозначается большое количество объектов.

Позиционная (разрядная) система применяется для кодирования объектов, имеющих два и более классификационных признака, для каждого из которых выделено определенное количество позиций (разрядов). Достоинство позиционной системы - в четком выделении любого числа классификационных признаков, что придает стройность и логичность построению структуры кода.

Комбинированная система представляет собой сочетание нескольких систем кодирования, что дает возможность сократить общую значность кода.

На последнем, четвертом этапе осуществляется непосредственное присвоение объектам кодовых обозначений, которые затем оформляются в виде справочников. На этом же этапе составляются методические положения по ведению кодовых обозначений и внесению в них изменений.

Для обмена статистической информацией между различными ЭИС осуществляется разработка и внедрение классификаторов.

Классификатор представляет собой систематизированный свод наименований и кодовых классификационных группировок данной системы классификации. В зависимости от применения они делятся на три группы:

  • общегосударственные, используемые во всех отраслях экономики;
  • отраслевые, используемые в пределах определенной отрасли экономики;
  • локальные, используемые в пределах отдельных предприятий и организаций.

Все общегосударственные классификаторы являются составной частью Единой системы классификации и кодирования технико-экономической информации (ЕСКК ТЭИ), используемой в различных ЭИС, и их применение в формах статистической отчетности и при обработке информации средствами вычислительной техники является обязательным условием для предприятий, организаций и учреждений всех отраслей экономики.

В органах государственной статистики функционирует около 20 общегосударственных классификаторов, относящихся к следующим группам:

  • классификаторы информации о трудовых и природных ресурсах;
  • классификаторы информации о продуктах труда, производственной деятельности и услугах;

28

  • классификаторы информации о структуре экономики и административно-территориальном делении страны;
  • классификаторы управленческой информации и документации.

Большинство общегосударственных классификаторов имеют блочную структуру, что создает возможности обработки информации на ПЭВМ при использовании кодовых обозначений отдельных блоков или их частей.

В качестве примера рассмотрим структуру общегосударственного классификатора промышленной и сельскохозяйственной продукции (ОКП) и единого государственного регистра предприятий и организаций (ЕГР-ПО), имеющих различную степень сложности.

Объектами ОКП являются кодовые обозначения промышленной и сельскохозяйственной продукции. Он состоит из двух блоков, представленных в табл. 2.1.

Таблица 2.1

Структура ОКП

Блок идентификации Блок наименования продукции
Идентификационный код КЧ
класс подкласс группа подгруппа вид
XX X X X X X ХХ...Х

Блок идентификации построен с применением шестиступенчатой иерархической системы классификации (класс - 2 разряда, подкласс - 1 разряд, группа - 1 разряд, подгруппа - 1 разряд, вид - 1 разряд и одноразрядное контрольное число (КЧ)), все ступени которой построены по позиционной системе кодирования.

КЧ рассчитывается по специальным формулам и применяется для защиты классификаторов от ошибок, возникающих в процессе кодирования и ввода данных в ПЭВМ.

Блок наименования содержит полное наименование промышленной и сельскохозяйственной продукции.

ЕГРПО представляет собой единую систему государственного учета и идентификации всех субъектов хозяйственной деятельности на территории Российской Федерации, объектами которой могут быть юридические лица, филиалы, представительства и индивидуальные предприниматели.

Структура ЕГРПО включает три блока и может быть представлена в виде табл. 2.2.

29

Таблица 2.2

Структура ЕГРПО

!!!ПРОВЕРЕННАЯ ТАБЛИЦА!!!

Блок
иденти-
фикации
Блок
наименова-
ния и
местонахож-
дения
предприятия,
организации
Блок классификационных признаков
Коды признаков
иденти-
фикаци-
онный
код
ОКПО
КЧ   министер-
ство
(СООГУ)
террито-
рия
(СОАТО)
отрасль
народно-
го
хозяй-
ства
(ОКОНХ)
форма
собствен-
ности
(КФС)
организа-
ционно-
правовая
форма
(КОПФ)
ххххххх x xx ....... x ххххх хххх ххххх xx xx

Каждый объект ЕГРПО идентифицируется семиразрядным кодом общегосударственного классификатора предприятий и организаций (ОКПО), построенного по серийно-порядковой системе кодирования (серии выделены по отдельным отраслям экономики), и одноразрядным КЧ.

Блок наименований и местонахождения объектов включает полное наименование предприятий (организаций), принятое в официальных документах, и отражает непосредственную связь предприятий с местом их конкретного расположения. Этот блок состоит из записей переменной длины, содержащих не более 200 символов.

Блок классификационных признаков построен по фасетной системе классификации и содержит:

  • четырехразрядные коды министерств и ведомств, закодированных по СООГУ (система обозначений органов государственного управления), которым подчинены предприятия;
  • четырехразрядные коды территорий, закодированных по СОАТО (система обозначений административно-территориальных объектов), на которых расположены предприятия;
  • пятиразрядные коды отраслей экономики, закодированных по ОКОНХ (общегосударственный классификатор отраслей народного хозяйства);
  • двухразрядные коды форм собственности, закодированных по КФС (классификатор форм собственности);
  • двухразрядные коды организационно-правовых форм, закодированных по КОПФ (классификатор организационно-правовых форм).

30

Коды министерств и ведомств по СООГУ построены по серийно-порядковой системе: старшие четыре разряда обозначают конкретное министерство, а младший - форму его подчинения (общегосударственное, местное и т.д.).

Коды территорий по СОАТО построены по позиционной системе кодирования. В данном случае из десятиразрядного кода СОАТО чаще всего используются только четыре старших разряда: коды республик, входящих в РФ, краев и областей. Остальными шестью младшими разрядами в СОАТО кодируются объекты регионального подчинения (административные районы, города, поселки городского типа и сельские органы власти), которые представляют интерес для местных и территориальных органов управления. Полный код СОАТО используется в ограниченных случаях, например при организации обработки данных переписи населения.

Коды отраслей экономики по ОКОНХ построены по позиционной системе кодирования, разряды которой размещаются по старшинству и выражают следующую классификацию: отрасль, подотрасль, вид, группа, подгруппа.

Коды форм собственности и организационно-правовой формы построены по серийно-порядковой системе, отражающей конкретную форму и ее виды.

31

Rambler's Top100
Lib4all.Ru © 2010.