Gallantries Grant - Intellectual Output 1 - Introduction to data analysis and -management, statistics, and coding

PURL: https://gxy.io/GTN:P00012

Comment: What is a Learning Pathway?

We recommend you follow the tutorials in the order presented on this page. They have been selected to fit together and build up your knowledge step by step. If a lesson has both slides and a tutorial, we recommend you start with the slides, then proceed with the tutorial.

This Learning Pathway collects the results of Intellectual Output 1 in the Gallantries Project

In total, this module will form a course of around 10 days (± 2 days depending on exact analysis stories we identify). Some of these introductory submodules will build on existing training material available in the GTN or Carpentries (~15%).

Success Criteria:

SC1.1) Basic coding skills. This module will cover the basics of the R and Python coding languages for novices. No coding experience will be assumed nor expected. Basic coding concepts will be introduced (variables, functions, data structures).
SC1.2) Research software development. We will cover best practices for research software development. It will follow Open Science principles, and include topics such as collaborative code development (e.g. git), reproducible research, code review, and quality control.
SC1.3) Familiarity with federated data analysis, management, and compute infrastructures. We will introduce the Galaxy platform, a user-friendly web-based analysis platform capable of distributing work across public/private clouds and High-Performance Computing (HPC) resources.
SC1.4) Basic statistical analysis skills. This submodule will cover the basic concepts involved in statistical analysis of scientific data.
SC1.5) Data acquisition and integration. Scientific data analyses often require interaction with external datasets. We will cover ways to retrieve data from online data sources, transform it to the required format, and integrate it into the analysis.
SC1.6) Reproducibility and data sharing. A cornerstone of scientific research is reproducibility. We will cover how to effectively share data and analysis pipelines in order to make scientific results optimally reproducible.

Year 1: Coding in Python

Intro to Coding in Python. Covers variables, functions, and data structures [SC1.1,2]

Lesson	Slides	Hands-on	Recordings
Introduction to Python tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Advanced Python tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 1: Coding in Python Modular (Avans)

Intro to Coding in Python. Covers variables, functions, and data structures [SC1.1,2]

In collaboration with Avans Hogeschool, an associated Partner we produced the following lessons

Lesson	Slides	Hands-on	Recordings
Python - Math tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Functions tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Basic Types & Type Conversion tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Lists & Strings & Dictionaries tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Flow Control tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Loops tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Try & Except tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Files & CSV tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Introductory Graduation tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Globbing tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Argparse tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Python - Subprocess tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Virtual Environments For Software Development tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Conda Environments For Software Development conda jupyter-notebook tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 1: Coding in R

Intro to Coding in R. Covers variables, functions, and data structures [SC1.1,2]

Lesson	Hands-on	Recordings
R basics in Galaxy interactive-tools R tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages video video Tutorial (February 2021) - 50m video View All	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	video video Tutorial (February 2021) - 50m video View All
Advanced R in Galaxy R tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages video video Tutorial (February 2021) - 1h video View All	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	video video Tutorial (February 2021) - 1h video View All
dplyr & tidyverse for data processing R rmarkdown-notebook jupyter-notebook tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 1: Intro to Command Line

This submodule will cover the basics of the shell (variables, for loops), needed for data handling [SC1.1,2,6]

Lesson	Slides	Hands-on	Recordings
CLI basics bash jupyter-notebook tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Advanced CLI in Galaxy bash jupyter-notebook tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
CLI Educational Game - Bashcrawl game bash jupyter-notebook tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Make & Snakemake tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 1: Intro to Git and GitHub

This submodule will cover the basics of research software development and sharing (committing, branching, forking, GitHub, etc.) [SC1.1,2,6]

Lesson	Slides	Hands-on
Version Control with Git tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Basics of using Git from the Command Line tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Contributing with GitHub via command-line plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages
Contributing with GitHub via its interface tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 2: Introduction to Genomics

This submodule covers the biological background, as well as the technological concepts involved in genome sequencing, and their effects on downstream data analysis. [SC1.3,4,6]

Year 2: Quality Control

This submodule will cover the evaluation of the quality of datasets, and how to improve quality by a cyclic process of cleaning, trimming and filtering datasets and re-evaluating the quality. [SC1.3-5]

Lesson	Slides	Hands-on	Recordings
Quality Control plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages video video Lecture (February 2021) - 40m video Tutorial (September 2024) - 51m video Tutorial (May 2023) - 50m video Tutorial (February 2021) - 1h10m video View All	plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	video video Lecture (February 2021) - 40m video Tutorial (September 2024) - 51m video Tutorial (May 2023) - 50m video Tutorial (February 2021) - 1h10m video View All

Year 2: Mapping

This submodule will cover the comparison of genome sequencing samples to a reference genome. The concept of reference data is relevant in many data analyses across life sciences; connecting to online databases and incorporating this data into an analysis. [SC1.3,4]

Lesson	Slides	Hands-on	Recordings
Mapping plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages video video Lecture (February 2021) - 10m video Tutorial (September 2024) - 24m video Tutorial (February 2021) - 20m video View All	plain text Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages Plain text slides	tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages	video video Lecture (February 2021) - 10m video Tutorial (September 2024) - 24m video Tutorial (February 2021) - 20m video View All

Year 3: Variant Analysis

This submodule will cover the topic of variant calling; after mapping of sequences to the reference genome, the regions that are different from the reference genome (variants) must be determined, and evaluated for impact. As any two individuals will by definition show many differences, the challenge of distinguishing between healthy variation and potential disease-causing variants is one of the main challenges in variant calling. [SC1.3-5]

Lesson	Slides	Hands-on	Recordings
Variant Calling Workflow tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages

Year 3: Transcriptomics

DNA only describes the potential of the genome; which genes are actually active within the cell and impacting the health and function of the organism, is determined via transcriptomics (RNA sequencing). By integrating data from these two levels of analysis (DNA and RNA), a clearer picture of the state of the cell can be obtained. [SC1.3-5]

Lesson	Slides	Hands-on	Recordings
RNA-seq Alignment with STAR tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages		tutorial Toggle Dropdown Automatic translations Deutsch Español 中文 Français 日本語 Português العربية More Languages