Continuand evaluarea serverului CouchDB 1.6.1, dupa ce am realizat cateva aplicatii de test, am indexat o baza de date de 700 de milioane de inregistrari cu Elasticsearch.
Indexarea am facut-o cu un program in Python, pe care am decis sa-l fac disponibil gratis pentru scopuri personale sau comerciale la github: ES-index-CouchDB1
Programul verifica periodic daca sunt modificari in baza de date, comparand secventa curenta cu ultima secventa a bazei de date si indexeaza daca exista diferente (adaugare/modificare/stergere documente CouchDB versiunea 1.x, nu merge cu CouchDB 2.x):
Orice modificare in baza de date CouchDB adauga o secventa noua la starea bazei de date.
Astfel am indexat o baza de date de test (benchmark) de 700 de milioane de valori:
In caz de eroare (de comunicatie cu serverul, de memorie, etc.) programul reporneste si continua indexarea: