Comments (8)
Lo ideal seria un management command que cree directamente instancias de nuestros modelos.
pero el tema es: no conocemos el UPC (codigo unico) entonces no podemos saber sin dudas si es un nuevo precio para un producto que ya conocemos.
que se les ocurre? pensaba un modelo que mapee plu (o directamente la url del producto en coto -> a un UPC conocido.
Pero pueden ser mas de 10mil productos y es demasiado para hacer por "voluntarios" (demasiado error). ¿quizas tratar de inferir lo más posible y si no hay conclusion unica entonces pedirle a los voluntarios?
from preciosa.
me: tengo muchos productos en coto
muchos sé que son los mismos productos que yo ya conozco (de los que tengo el UPC)
pero no sé distinguirlos facilmente. Cómo se cual de coto es cual que yo conozco?
Para un humano es mas o menos facil saber que "salsa tomate arcor 500ml" es lo mismo que "Salsa de Tomate Arcor x 500 ml"
para un algoritmo no es taaan facil
pero en cualquier caso siempre hay error
que hacemos?
lo de la tabla de mapa, seria el resultado final: cuando necesites saber el precio de coto del UPC tal, andá a esta URL de cotodigital
se entiende?
Juan: distancia de hamming
en realidad
distancia de demerau hamming
from preciosa.
Yo hago en Managment command para esto e implemento el scraper. Una vez que tengamos los datos, puedo colaborar en el tema del merging.
- Tenemos alguna estructura para los scraper?
- Tenemos alguna estructura para los comandos?
python manage.py ¿scrap? ¿coto?
o
python manage.py ¿coto?
from preciosa.
Me autoasigno esta tarea, si ya hay estructura en el tema de scrapping, avísenme, sino yo la defino y trato de integrar los otros scrappers.(Hay otros scrappers'?)
Saludos, Jairo
from preciosa.
2014-02-17 1:05 GMT-03:00 Jairo Trad [email protected]:
- Tenemos alguna estructura para los scraper?
los scrappers que hay ahora, muy disimiles en técnicas y calidad, están
todos en /tools . Pero la idea es ir migrando lo que vamos a usar
recurrentemente (en particular scrapping de productos y precios) como
management commands
- Tenemos alguna estructura para los comandos?
python manage.py ¿scrap? ¿coto?
python manage.py ¿coto?
quizas el segundo, dentro de la app precios
mgaitan.github.io
textosyprextextos.com.ar
from preciosa.
Como se "Muestra" el precio por unidad de medida? osea... que formato estan usando. La web me devuelve esto:
"'(Precio por cada 1 Kilo : $69.3)'"
from preciosa.
Jairo, el modelo Producto
tiene esto ahora
contenido = models.DecimalField(max_digits=5, decimal_places=1,
null=True, blank=True)
unidad_medida = models.CharField(max_length=10,
choices=UNIDADES_CHOICES, null=True, blank=True)
donde unidad_medidad
puede ser algunas constantes
Pero no nos hace falta saber el precio "normalizado" (cada 1kg, litro, etc), eso lo vamos a calcular nosotros a nuestra conveniencia.
Por ahora, sólo si podés, llena los dos field. Ejemplo, el paquete trae 580 gramos, será:
pondrás en contenido = 580
y en unidad_medida = Producto.UM_GRAMO
Voy a crear un ticket para agregar un precio normalizado de un producto.
from preciosa.
Hola que tal... existe una API para consultar los datos de los productos de coto o algun supermercado??
Gracias!
from preciosa.
Related Issues (20)
- Actualizar dependencias a nuevas versiones HOT 1
- Función "lista de compras" HOT 1
- Funcion "Compra actual"
- Funcion "historial de compras"
- TemplateSyntaxError Invalid filter: 'thumbnail_url' HOT 1
- No funciona el autocompleter del buscador HOT 1
- No se puede correr tests
- Categorías de Empresas HOT 1
- Función: Suscribirse a Categoría o Producto o Usuario HOT 1
- importar datasets de super onlines disponibles en scrapinghub
- utilizar trigram de Django 1.10 para recuperar similaridad HOT 1
- Función: Registrar tipo de unidad de producto y calcular precio por unidad base
- Función: Registrar origen del producto o fabricante HOT 3
- autocompletado del buscador se ve feo
- Matching de sucursales de Precios Claros a las de Preciosa
- Importador PreciosClaros desde scrapinghub
- Spider via scrapy para alacena
- Scraper (o contacto) para TiendaConsol
- Soportar productos sin Código de Barras
- Soportar codigosr de barra internos de los super
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from preciosa.