Skip to content

papyrussolution/UhttBarcodeReference

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

36 Commits
Β 
Β 
Β 
Β 

Repository files navigation

UhttBarcodeReference

Universe-HTT barcode reference

Universe-HTT

Компания ΠŸΠ΅Ρ‚Ρ€ΠΎΠ³Π»ΠΈΡ„

OpenPapyrus

Π‘Π°ΠΌΡ‹ΠΉ большой ΠΈ Π°ΠΊΠΊΡƒΡ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ справочник ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄ΠΎΠ² Π² ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π΅! Если Π½Π΅ Π²Π΅Ρ€ΠΈΡ‚Π΅ - поисковики ΠΏΠΎΠΌΠΎΠ³ΡƒΡ‚ Ρ€Π°Π·Π²Π΅ΡΡ‚ΡŒ сомнСния. Π‘ΠΎΠ»Π΅Π΅ 5 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² 700 тысяч ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄ΠΎΠ² стандартов ean13,ean8,upc-e,upc-a с ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌΠΈ наимСнованиями, брэндами ΠΈ катСгориями.

ΠšΡ€ΠΎΠΌΠ΅ ΠΏΡ€ΠΎΡ‡Π΅Π³ΠΎ, Π±Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ… Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² сСбя всС Π²Π°Π»ΠΈΠ΄Π½Ρ‹Π΅ ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄Ρ‹, прСдставлСнныС Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… USDA Food Composition Databases (ΠΏΠΎ ΡΠΎΡΡ‚ΠΎΡΠ½ΠΈΡŽ Π½Π° август 2018 Π³ΠΎΠ΄Π°).

ΠžΡ€ΠΈΠ³ΠΈΠ½Π°Π» справочника находится Π½Π° сСрвСрС Universe-HTT - здСсь ΠΌΡ‹ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π°Π΅ΠΌ Π΅Π³ΠΎ копию, ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‰ΡƒΡŽ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ поля:

  • (ID) Π˜Π΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ Ρ‚ΠΎΠ²Π°Ρ€Π° Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… Universe-HTT
  • (UPCEAN) Π¨Ρ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄
  • (Name) НаимСнованиС Ρ‚ΠΎΠ²Π°Ρ€Π°
  • (CategoryID) Π˜Π΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… Universe-HTT
  • (CategoryName) НаимСнованиС ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ
  • (BrandID) Π˜Π΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ брэнда Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… Universe-HTT
  • (BrandName) НаимСнованиС брэнда

Π”Π°Π½Π½Ρ‹Π΅ прСдставлСны Π² тСкстовом Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ Π² ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²ΠΊΠ΅ UTF-8 с символом табуляции (0x09) Π² качСствС раздСлитСля ΠΏΠΎΠ»Π΅ΠΉ.

ΠŸΡ€ΠΈ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ этого справочника ΠΈΠ· ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π° ΠΈΠ·Π²Π»Π΅ΠΊΠ°ΡŽΡ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π²Π°Π»ΠΈΠ΄Π½Ρ‹Π΅ UPC/EAN ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄Ρ‹. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, всС ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄Ρ‹ Π² этом Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΈ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ ΡƒΠΊΠ°Π·Π°Π½Π½Ρ‹ΠΌ стандартам (Ρ‡Ρ‚ΠΎ Π½Π΅ ΠΈΡΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ). ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄Ρ‹ EAN13 с Π²Π΅Π΄ΡƒΡ‰Π΅ΠΉ Ρ†ΠΈΡ„Ρ€ΠΎΠΉ 2 (ΠΏΡ€ΠΈΠ²Π°Ρ‚Π½Ρ‹Π΅ ΠΊΠΎΠ΄Ρ‹) практичСски ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ (Π±Π΅Π· Π³Π°Ρ€Π°Π½Ρ‚ΠΈΠΈ).

Π Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ Π² ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³Π΅ DATA содСрТит Π΄Π°Π½Π½Ρ‹Π΅, Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹Π΅ Π½Π° Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚Ρ‹ (ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ ΠΏΠΎ 1Мб ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ). ΠŸΠΎΠ»Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ», ΡƒΠΏΠ°ΠΊΠΎΠ²Π°Π½Π½Ρ‹ΠΉ Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ 7z, находится Π² Ρ€Π΅Π»ΠΈΠ·Π°Ρ….

Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ„Π°ΠΉΠ»Ρ‹:

  • uhtt_barcode_ref_stat.txt - статистика: ΠΎΠ±Ρ‰Π΅Π΅ количСство ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄ΠΎΠ² (barcode-count), количСство брэндов (brand-count), количСство ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ (categ-count), количСство слов (word-count)
  • uhtt_barcode_ref_brand_concord.csv - список брэндов с количСством ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄ΠΎΠ², ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ. ΠžΡ‚ΡΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ ΠΏΠΎ наимСнованию.
  • uhtt_barcode_ref_category_concord.csv - список ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ с количСством ΡˆΡ‚Ρ€ΠΈΡ…ΠΊΠΎΠ΄ΠΎΠ², ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΊΠ°ΠΆΠ΄ΠΎΠΉ. ΠžΡ‚ΡΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ ΠΏΠΎ Π½Π°ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½ΠΈ.
  • uhtt_barcode_ref_word_concord_bytext.csv - список слов ΠΈΠ· Π½Π°ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½ΠΈΠΉ Ρ‚ΠΎΠ²Π°Ρ€ΠΎΠ² с частотой ΠΏΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. ΠžΡ‚ΡΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π² лСксикографичСском порядкС.
  • uhtt_barcode_ref_word_concord_byfreq.csv - список слов ΠΈΠ· Π½Π°ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½ΠΈΠΉ Ρ‚ΠΎΠ²Π°Ρ€ΠΎΠ² с частотой ΠΏΠΎ всСй Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. ΠžΡ‚ΡΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ ΠΏΠΎ частотС.

Π’ качСствС благодарности, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ Π·Π²Π΅Π·Π΄ΠΎΡ‡ΠΊΠΎΠΉ этот Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ, Π° Ρ‚Π°ΠΊ ΠΆΠ΅ Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ OpenPapyrus ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΈΠΌΠ΅Π½Π½ΠΎ эту Π²Π΅Π»ΠΈΠΊΠΎΠ»Π΅ΠΏΠ½ΡƒΡŽ ERP-систСму ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ для администрирования, ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈ обСспСчСния доступа ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ справочника Ρ‡Π΅Ρ€Π΅Π· ΠΏΠΎΡ€Ρ‚Π°Π» Universe-HTT.


The largest and most accurate open reference book of bar codes on the Internet! If you do not believe it, the search engines will help dispel doubts. More than 5 million 700 thousand bar codes of ean13, ean8, upc-e, upc-a standards with corresponding names, brands and categories.

Among other things, the database includes all valid barcodes presented in the USDA Food Composition Databases (as of August 2018).

The original directory is located on the Universe-HTT server - here we place its copy containing the following fields:

  • (ID) The identifier of the goods in the Universe-HTT database
  • (UPCEAN) Barcode
  • (Name) Product name
  • (CategoryID) Category ID in the Universe-HTT database
  • (CategoryName) Category name
  • (BrandID) Brand identifier in the Universe-HTT database
  • (BrandName) Brand name

Data is presented in text format in UTF-8 encoding with a tab (0x09) as a field separator.

When creating this directory, only valid UPC / EAN barcodes are extracted from the original. Thus, all barcodes in this repository are guaranteed to meet the specified standards (which does not exclude some other problems). In addition, bar codes EAN13 with leading digit 2 (private codes) are practically absent (without warranty).

The repository in the DATA directory contains data broken into fragments (approximately 1MB each). The complete file, packed in 7z format, is in releases.

Additional files:

  • uhtt_barcode_ref_stat.txt - statistics: the total number of bar codes (barcode-count), the number of brands (brand-count), the number of categories (categ-count), the number of words (word-count)
  • uhtt_barcode_ref_brand_concord.csv - a list of brands with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_category_concord.csv - a list of categories with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_word_concord_bytext.csv - a list of words from product names with a frequency across the entire sample. Sorted out in lexicographical order.
  • uhtt_barcode_ref_word_concord_byfreq.csv - a list of words from product names with a frequency across the entire sample. Sorted by frequency.

As gratitude, you can mark this repository with an asterisk, as well as the OpenPapyrus repository, since we use this excellent ERP-system for administration, processing and access to the directory data through the portal Universe-HTT.