Перевод заглавия: METHODS OF STANDARDISING AND CODING BIRTHPLACE STRINGS AND OCCUPATIONAL TITLES BRITISH CENSUSES 1851-1911
Кл.слова (ненормированные):
стандартизация -- классификация -- обработка текстуальных данных -- перепись населения -- великобритания -- Historic census data -- Birthplace standardisation -- Occupation coding
Аннотация: Представлены методы стандартизации и классификации текстуальных записей о месте рождения и профессиональной деятельности, полученных по данным переписи населения Англии, Уэльса и Шотландии за 1851-1911 гг. Разработаны алгоритмы формирования классификационных кодов профессий и идентификации географических районов на основе сопоставления исходных и справочных данных. Предложенные методы основаны на интеграции вычислительных технологий, математических методов и экспертных знаний.
This paper presents a technique of standardising and coding textual birthplace and occupation strings in the censuses of England and Wales and Scotland, 1851-1911. The approaches are based upon the integration of the computer technologies, mathematical methods and expert knowledge. The classification of occupations is defined by two algorithms based on statistical decision theory in order to allocate codes from the original occupation strings. The method of standardising parishes is based on the comparison of original birthplace strings and reference data.
РИНЦ
Держатели документа:
Институт вычислительного моделирования
Университет Лестера
Доп.точки доступа:
Шурер, Кевин; Schurer Kevin; Пенькова, Татьяна Геннадьевна; Penkova Tatyana G.