Home
FAQsPrinciples
Contribute data
Gather logo

FAQs

Here are the answers to our most frequently asked questions. If you have any other questions, please contact us. You are also welcome to download and read this summary report.

English

What do you mean by availability, accessibility and accuracy?

  • Availability: does the dataset we need exist?
  • Accessibility: what effort is required to download and interact with the dataset?
  • Accuracy: how complete and consistent is the dataset? What is the dataset’s resolution and cleanness?

What do you mean by improving the integrity of data?

We believe in the responsible and fair use of location data to improve sanitation infrastructure and services for vulnerable communities. We want to help the sanitation sector work together to make sure that data can be – and is – used for the public good. To do this, we need to understand the current state of sanitation data and agree principles to improve it.

What methodology have you used to assess the data?

We used the ODI’s Data Ethics Canvas and other resources to help frame our list of seventeen questions. You can learn more about our methodology in our Summary Report.

Why have you included datasets on environment and social? Is the list of datasets final?

Our primary focus is on how and why data is used to make better decisions. We believe that these datasets are needed to create useful maps to understand the state of sanitation in an area. This is also why we have included complementary datasets such as ‘road network’ under the sanitation value chain. The categories are guides – and we are open to adding more datasets as are useful for decision makers.

Why only publicly available data?

We had to start somewhere! We are hopeful that this project can extend to consider sanitation data that is not publicly available.

Does any of the publicly available datasets include private, personally identifiable information

We believe there is low risk of reverse engineering the publicly available data to identify or individuals or households. The location of toilets does inevitably give the location of a public place or home. Our recommendation for organisations collecting this data is to only share a redacted dataset that has either been aggregated or clustered so that specific toilets cannot be identified.

Why these fifty countries?

These fifty countries come at the end of the United Nation’s Human Development Index. We have deliberately not ranked countries. Our goal is not to create competition but inspire collaboration. We hope to develop the comparison tool to provide further insight for decision-makers.

Why are the assessments similar for each country?

The best quality datasets for the environment and social categories were often global in scope. The datasets for the value chain varied from country to country but were of similar, low quality. We start to see variation between assessments when we look at the cities because of the availability of more datasets.

How did you use the ODI’s Data Ethics Canvas?

The Canvas was invaluable to us throughout this project. We initially thought we would use the Canvas to interrogate the data. Instead, we used the Canvas’ questions to help us consider the ethical challenges of the project. For example:

  • We decided not to rank the countries’ assessments against each other. This would have risked unhelpful competition or the unhelpful implication that one country’s data capacity is worse than another based on an assessment of only publicly available datasets.
  • We recognised that just presenting the assessments would not lead to change. The principles are needed to guide conversation on how and why the sector can collect better data to make good decisions.
  • We have been clear that our assessments are a starting point. The reason for us inviting organisations to contribute data is so that we can diversify sources and improve the benchmark.

What are the current limits of this tool?

The assessments in this tool are not final. They are the result of our current assessment of the publicly available, national datasets that we were able to identify in the space of three months.

Our goal is to help improve the quality of sanitation data so that good decisions can be made. As such, we are keen to receive critiques of our methodology and be told about datasets that we haven’t identified or included. We believe that this collaboration is the best way to improve the benchmark for each country and city.

If I/we sign up to the principles do we have to publish our data?

No. We have to be responsible and balance transparency, openness and privacy. Datasets do not need to be published for them to be assessed and contribute to the benchmark for a country of city.

How can I/we learn more about the ethics of location and sanitation data?

We recommend the ODI’s Data Ethics Canvas and Omidyar Network’s Ethical Explorer as useful tools for you and your team to think about how and why you are collecting data throughout your project.

What’s next for this project?

We have four next steps:

  1. Encourage individuals and organisations across the sanitation sector to sign up to our principles. We need to build a global, diverse movement to join us to improve the quality of sanitation data.
  2. Encourage organisations to contribute data. Our assessments are good but they are not perfect. We want to reach out to local organisations to help us improve the benchmark for their country or city.
  3. Expand our assessments to include more cities. Our initial exploration suggests there is more data available at the city level.
  4. Improve the accessibility of the tool. We have also translated our principles and data contribution into French. We are keen to make our entire tool available in more local languages so that more decision-makers can engage with it.

Français

Qu'entendez-vous par disponibilité, accessibilité et exactitude?

  • Disponibilité: est ce que l’ensemble de données que nous souhaitons existent?
  • Accessibilité: quels sont les efforts requis pour télécharger et traiter l'ensemble de données?
  • Précision: dans quelle mesure l'ensemble de données est-il complet et cohérent? Quelle est la résolution et la propreté de l'ensemble de données?
  • Qu'entendez-vous par l’amélioration de l'intégrité des données?

    Nous sommes persuades à l'usage responsable et équitable des données de localisation afin d’améliorer les infrastructures et les services d'assainissement pour les communautés vulnérables. Nous souhaitons aider le secteur de l'assainissement à travailler ensemble pour nous assurer que les données peuvent être - et sont - utilisées pour le bien public. Pour ce faire, nous devons comprendre l'état actuel des données d'assainissement et mettons d’accord sur les principes pour l'améliorer.

    Quelle est la méthodologie que vous avez adoptée pour évaluer les données?

    Nous avons utilisé le Canevas d'éthique des données de l'ODI et d'autres ressources pour nous aider à encadrer notre liste de dix-sept questions. Vous pouvez mieux connaître notre méthodologie dans notre rapport de synthèse.

    Pourquoi avez-vous inclus les ensembles de données sur l’environnement et les données sociales? La liste des ensembles de données est-elle définitive?

    Notre objectif principal est de savoir comment et pourquoi les données sont utilisées pour la meilleure prise de décisions. Nous sommes persuadés que ces ensembles de données sont nécessaires pour créer des cartes utiles afin de savoir l'état de l'assainissement dans une zone. C’est aussi la raison pour laquelle nous avons inclus des ensembles de données complémentaires, tels que le «réseau routier», dans la chaîne de valeur de l’assainissement. Les catégories sont des guides - et nous sommes disposés pour l'ajout d'ensemble de données additionnelles que les décideurs peuvent utiliser.

    Pourquoi uniquement des données accessibles au public?

    Nous devons commencer quelque part! Nous espérons que ce projet va s'étendre pour prendre en compte les données d'assainissement qui ne sont pas accessibles au public.

    Est ce que les ensembles de données accessibles au public comprennent des informations privées et personnellement identifiables?

    Nous pensons qu'il existe un faible risque d’ingénierie inversée des données accessibles au public pour identifier les individus ou les ménages. L'emplacement des toilettes donne inévitablement l'emplacement d'un lieu public ou de domicile. Nous recommandons les organisations qui collectent ces données à partager seulement l’ensemble de données censuré qui a été soit cumulatif soit groupé pour que des toilettes spécifiques ne puissent pas être identifiées.

    Pourquoi ces cinquante pays?

    Ces cinquante pays sont les derniers apparus dans l’Indice de Développement Humain des Nations Unies. Nous n'avons pas classé intentionnellement les pays. Notre objectif n'est pas de créer de la concurrence mais de susciter la collaboration. Nous souhaitons développer l'outil de comparaison pour fournir des informations additionnelles aux décideurs.

    Pourquoi les évaluations sont-elles les mêmes pour chaque pays?

    La meilleure qualité d’ensembles de données pour l'environnement et les catégories sociales est souvent d’envergure mondiale. Les ensembles de données de la chaîne de valeur variaient d'un pays à l'autre, mais ont été similaires et de faible qualité. Au début, nous avons constaté des variations entre les évaluations lorsque nous examinons les villes à cause de la disponibilité d’autres ensembles de données.

    Quelles sont les seuils actuels de cet outil?

    Les évaluations avec cet outil ne sont pas définitives. Ils présentent le résultat de notre évaluation actuelle des ensembles de données nationaux, accessibles au public, que nous avons pu identifier pendant trois mois.

    Notre objectif est de contribuer à l’amélioration de la qualité des données d'assainissement afin que des bonnes décisions puissent être prises. A cet effet, nous souhaitons recevoir des critiques à propos de notre méthodologie et être informés des ensembles de données que nous n'avons pas identifiés ou inclus. Nous pensons que cette collaboration est le meilleur moyen d'améliorer la référence pour chaque pays et ville.

    Si je souscris / nous souscrivons aux principes, est ce que nous sommes obliges de publier nos données?

    Non. Nous devons être responsables et équilibrer la transparence, l'ouverture et la confidentialité. On n’a pas besoin de publier les ensembles de données pour être évalués et contribuer à la référence pour un pays ou une ville.

    Comment puis-je / pouvons-nous avoir plus de détail sur l'éthique des données de localisation et d'assainissement?

    Nous recommandons le Canevas de l’Ethique de Donnée de l'ODI et l’Ethical Explorer d’Omidyar Network comme outils importants pour vous et votre équipe dans la reflexion sur la manière et les raisons de la collecte de données tout au long de votre projet.

    Quelle est la suite de ce projet?

    Nous avons quatre prochaines étapes:

    1. Encourager les particuliers et les organisations du secteur de l'assainissement à adhérer à nos principes. Nous devons construire un mouvement mondial et diversifié pour nous rejoindre afin d'améliorer la qualité des données sur l'assainissement.
    2. Encourager les organisations à fournir des données. Nos évaluations sont bonnes mais elles ne sont pas parfaites. Nous souhaitons nous rapprocher des organisations locales pour nous aider à améliorer la référence pour leur pays ou leur ville.
    3. Étendre nos évaluations pour inclure plus de villes. Notre premier analyse suggère qu'il y a plus de données disponibles au niveau de la ville.
    4. Améliorez l'accessibilité à l'outil. Nous avons également traduit nos principes et notre apport de données en français. Nous souhaitons mettre l'ensemble de notre outil disponible dans plusieurs langues locales afin que d’autres décideurs puissent s'y intéresser.

    This project from Gather was supported by the Benchmark Initiative and the Omidyar Network's Place Fund. Have questions? Get in touch

    Gather, Sutton Yard, 4th Floor, 65 Goswell Road, London, EC1V 7EN

    Gather is a registered charity in the UK (charity no. 1168130). We respect your privacy and will only use your information to respond to direct contact with us. View our policies linked above for more information and send us an email if you have any questions.

    © 2020, Gather. All rights reserved. Website design by London Digital Agency Ryland Consulting.