Giter Club home page Giter Club logo

Comments (11)

yohanboniface avatar yohanboniface commented on July 21, 2024

Répondu sur #4. :)

from addok.

yohanboniface avatar yohanboniface commented on July 21, 2024

FYI, une version expérimentale de l'export en stream json est disponible ici: http://bano.openstreetmap.fr/data/test/full.sjson.gz

from addok.

ksahin avatar ksahin commented on July 21, 2024

Encore une petite question, c'est censé prendre combien de temps l'import dans redis ?

Car au début de l'import, ça me prend a peu près 2 secondes par paquet de 10 000, et a partir d'un moment (3 millions ) ça prend jusqu'a 400 secondes :

Done 3270000 4410.2940220832825
Done 3280000 4808.93149638176
Done 3290000 5236.812336921692
Done 3300000 5326.398064374924
Done 3310000 5394.085289716721
Done 3320000 5451.391182422638
Done 3330000 5496.172105550766
Done 3340000 5705.732786178589
Done 3350000 5961.771647930145
Done 3360000 6050.331816196442
Done 3370000 6133.646873950958

Merci bien

from addok.

yohanboniface avatar yohanboniface commented on July 21, 2024

Sur notre serveur ça prend 20 minutes environ.
Note que Redis a la contrainte de devoir tenir en RAM. Aux dernières nouvelles, la base (pour la France entière) faisait autour de 15 Go.
Donc si tu as des perfs aussi dégradées, il est fort possible que tu aies atteint ton plafond de RAM dispo :/

from addok.

ksahin avatar ksahin commented on July 21, 2024

Je pense qu'il doit lui falloir plus que 15 go pour l'import !

J'ai 16go sur le serveur, il n'y a que ça qui tourne, et j'ai toute la ram pleine, +5go de swap utilisé, c'est ça qui doit me plomber les perfs ...

Enfin bref, ya plus qu'a être patient.
Merci en tout cas

from addok.

yohanboniface avatar yohanboniface commented on July 21, 2024

Ah oui, peut-être que pendant l'import il prend plus, j'ai pas trop regardé. Je jetterai un œil lors du prochain import (ping @cquest vu que c'est lui qui s'en charge en général).

from addok.

yohanboniface avatar yohanboniface commented on July 21, 2024

Oops:

used_memory_human: 17.21G

Donc on dépasse 16 maintenant :/

from addok.

ksahin avatar ksahin commented on July 21, 2024

Ok , bon je verrais bien . Merci

from addok.

ksahin avatar ksahin commented on July 21, 2024

Je viens de monter un nouveau serveur avec 26go de ram du coup, mais j'ai un petit soucis d'encoding j'ai l'impression :

(addok2)kevin@XXXX:~/addok$ python run.py import full.sjson 
Traceback (most recent call last):
  File "run.py", line 24, in <module>
    from addok.debug import Cli
  File "/home/kevin/addok/addok/debug.py", line 13, in <module>
    from .core import (DB, Search, document_key, token_frequency, make_fuzzy,
  File "/home/kevin/addok/addok/core.py", line 9, in <module>
    from .pipeline import preprocess_query
  File "/home/kevin/addok/addok/pipeline.py", line 5, in <module>
    PROCESSORS = [import_by_path(path) for path in config.PROCESSORS]
  File "/home/kevin/addok/addok/pipeline.py", line 5, in <listcomp>
    PROCESSORS = [import_by_path(path) for path in config.PROCESSORS]
  File "/home/kevin/addok/addok/utils.py", line 12, in import_by_path
    module = import_module(module_path)
  File "/home/kevin/.virtualenvs/addok2/lib/python3.4/importlib/__init__.py", line 109, in import_module
    return _bootstrap._gcd_import(name[level:], package, level)
  File "/home/kevin/addok/addok/textutils/default/__init__.py", line 37, in <module>
    load_synonyms()
  File "/home/kevin/addok/addok/textutils/default/__init__.py", line 26, in load_synonyms
    for line in f:
  File "/home/kevin/.virtualenvs/addok2/lib/python3.4/encodings/ascii.py", line 26, in decode
    return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 1: ordinal not in range(128)

Pourtant j'ai exactement le même système que sur le premier serveur, ubuntu 14.04, j'ai tout installé de la même manière.

Vous avez une idée ?

Merci

Edit : comme dis dans mes précédents messages, je ne connais pas grand chose a Python, mais d'après ce que je lis sur stack overflow il faudrait pas un petit .decode('utf-8') quelque part vu que le fichier full.sjson est encodé en utf-8 et que Python l'interprête comme de l'ascii ?

from addok.

yohanboniface avatar yohanboniface commented on July 21, 2024

que donne la commande suivante?

locale

from addok.

ksahin avatar ksahin commented on July 21, 2024
(addok2)kevin@XXXX:~/addok$ locale
locale: Cannot set LC_CTYPE to default locale: No such file or directory
locale: Cannot set LC_ALL to default locale: No such file or directory
LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE=fr_FR.UTF-8
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

C'est bon ça marche, c'était un soucis de locale.

from addok.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.