Giter Club home page Giter Club logo

uhttbarcodereference's Introduction

UhttBarcodeReference

Universe-HTT barcode reference

Universe-HTT

Компания Петроглиф

OpenPapyrus

Самый большой и аккуратный открытый справочник штрихкодов в интернете! Если не верите - поисковики помогут развеять сомнения. Более 5 миллионов 700 тысяч штрихкодов стандартов ean13,ean8,upc-e,upc-a с соответствующими наименованиями, брэндами и категориями.

Кроме прочего, база данных включает в себя все валидные штрихкоды, представленные в базе данных USDA Food Composition Databases (по состоянию на август 2018 года).

Оригинал справочника находится на сервере Universe-HTT - здесь мы размещаем его копию, содержащую следующие поля:

  • (ID) Идентификатор товара в базе данных Universe-HTT
  • (UPCEAN) Штрихкод
  • (Name) Наименование товара
  • (CategoryID) Идентификатор категории в базе данных Universe-HTT
  • (CategoryName) Наименование категории
  • (BrandID) Идентификатор брэнда в базе данных Universe-HTT
  • (BrandName) Наименование брэнда

Данные представлены в текстовом формате в кодировке UTF-8 с символом табуляции (0x09) в качестве разделителя полей.

При формировании этого справочника из оригинала извлекаются только валидные UPC/EAN штрихкоды. Таким образом, все штрихкоды в этом репозитории гарантированно соответствуют указанным стандартам (что не исключает некоторых иных проблем). Кроме того, штрихкоды EAN13 с ведущей цифрой 2 (приватные коды) практически отсутствуют (без гарантии).

Репозиторий в каталоге DATA содержит данные, разбитые на фрагменты (примерно по 1Мб каждый). Полный файл, упакованный в формате 7z, находится в релизах.

Дополнительные файлы:

  • uhtt_barcode_ref_stat.txt - статистика: общее количество штрихкодов (barcode-count), количество брэндов (brand-count), количество категорий (categ-count), количество слов (word-count)
  • uhtt_barcode_ref_brand_concord.csv - список брэндов с количеством штрихкодов, соответствующих каждому. Отсортированы по наименованию.
  • uhtt_barcode_ref_category_concord.csv - список категорий с количеством штрихкодов, соответствующих каждой. Отсортированы по наименовани.
  • uhtt_barcode_ref_word_concord_bytext.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы в лексикографическом порядке.
  • uhtt_barcode_ref_word_concord_byfreq.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы по частоте.

В качестве благодарности, вы можете отметить звездочкой этот репозиторий, а так же репозиторий OpenPapyrus поскольку именно эту великолепную ERP-систему мы используем для администрирования, обработки и обеспечения доступа к данным справочника через портал Universe-HTT.


The largest and most accurate open reference book of bar codes on the Internet! If you do not believe it, the search engines will help dispel doubts. More than 5 million 700 thousand bar codes of ean13, ean8, upc-e, upc-a standards with corresponding names, brands and categories.

Among other things, the database includes all valid barcodes presented in the USDA Food Composition Databases (as of August 2018).

The original directory is located on the Universe-HTT server - here we place its copy containing the following fields:

  • (ID) The identifier of the goods in the Universe-HTT database
  • (UPCEAN) Barcode
  • (Name) Product name
  • (CategoryID) Category ID in the Universe-HTT database
  • (CategoryName) Category name
  • (BrandID) Brand identifier in the Universe-HTT database
  • (BrandName) Brand name

Data is presented in text format in UTF-8 encoding with a tab (0x09) as a field separator.

When creating this directory, only valid UPC / EAN barcodes are extracted from the original. Thus, all barcodes in this repository are guaranteed to meet the specified standards (which does not exclude some other problems). In addition, bar codes EAN13 with leading digit 2 (private codes) are practically absent (without warranty).

The repository in the DATA directory contains data broken into fragments (approximately 1MB each). The complete file, packed in 7z format, is in releases.

Additional files:

  • uhtt_barcode_ref_stat.txt - statistics: the total number of bar codes (barcode-count), the number of brands (brand-count), the number of categories (categ-count), the number of words (word-count)
  • uhtt_barcode_ref_brand_concord.csv - a list of brands with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_category_concord.csv - a list of categories with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_word_concord_bytext.csv - a list of words from product names with a frequency across the entire sample. Sorted out in lexicographical order.
  • uhtt_barcode_ref_word_concord_byfreq.csv - a list of words from product names with a frequency across the entire sample. Sorted by frequency.

As gratitude, you can mark this repository with an asterisk, as well as the OpenPapyrus repository, since we use this excellent ERP-system for administration, processing and access to the directory data through the portal Universe-HTT.

uhttbarcodereference's People

Contributors

myback avatar papyrussolution avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

uhttbarcodereference's Issues

Submit UPC

Hello,

You guys are doing a wonderful job. I would like to request an option for the public to submit new UPC codes which are currently not available in the data.

For e.g.

I have the details of a new UPC: 620641014862
Name: Onglyza 5mg
Manufacturer: AstraZeneca Canada Inc.

It would be great if I have an option to submit this new UPC to your data.

В чем открыть файл

При открытиии в Excel(последняя версия) пишет "Файл открыт не полностью". В какой программе открыть файл полностью для поиска штрих-кода, или как его разбить на части?

Ошибка в данных

3488233	4606654000050	Ополаскиватель для рта антикариес (астрадент) 250мл	23559	Продукты питания (folder)/Рыба и морепродукты (folder)/Пресервы	0

Кажется это должна быть категория 19414 Гигиена (folder)/Уход за зубами и ртом (folder)/Ополаскиватель для рта

Fix some lines in file

When i tryed loading csv into MySQL, i had some errors

  1. Incorrect integer value: 'Неклассифицированные/default' for column 'CategoryID' at row
    306582, 643471, 673572, 2477589 and other.
    Problem is "\sometex<tab>"

  2. Row 1892431,2171203,2402313,2882039 doesn't contain data for all columns

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.