Data Generation

Python Modules
`recipes.cec2.baseline.data_generation.build_additional_scenes`
`recipes.cec2.baseline.data_generation.render_additional_scenes`
Configuration Files
additional_data_config.yaml
path:
  root: ???
  metadata_dir: ${path.root}/clarity_data/metadata
  additional_data_file: ${path.metadata_dir}/scenes.train_additional.json

random_seed: 0
shuffle_rooms: True

# Instantiate_scenes
scene_datasets:
  train:
    n_scenes: 10000
    room_selection: RANDOM
    scene_start_index: 10001

target:
  target_speakers: ${path.metadata_dir}/target_speech_list.json
  target_selection: RANDOM
  pre_samples_range: [66150, 88200]
  post_samples_range: [44100, 44100]

snr_range:
  train: [-12, 6]

interferer:
  speech_interferers: ${path.metadata_dir}/masker_speech_list.json
  noise_interferers: ${path.metadata_dir}/masker_nonspeech_list.json
  music_interferers: ${path.metadata_dir}/masker_music_list.json
  number: [2, 3]
  start_time_range: [0, 0]
  end_early_time_range: [0, 0]

listener:
  heads: ["BuK", "DADEC", "KEMAR", "VP_E1",  "VP_E2", "VP_E4", "VP_E5", "VP_E6", "VP_E7", "VP_E8", "VP_E9", "VP_E11", "VP_E12", "VP_E13", "VP_N1", "VP_N3", "VP_N4", "VP_N5", "VP_N6"]
  channels: ["ED", "BTE_fr", "BTE_mid", "BTE_rear"]
  # parameters all in units of samples or degrees
  # The time at which the head turn starts relative to target speaker onset
  relative_start_time_range: [-28004, 38147]  # -0.635 s to 0.865 s
  # Rotations have a normally distributed duration
  duration_mean: 8820
  duration_sd: 441  # 100 ms
  # Head is initially pointing away from talker, uniform within a range
  # Note it can be either offset to left or right - drawn at random
  angle_initial_mean: 25
  angle_initial_sd: 5
  # Head turns to point at the speaker within some margin
  angle_final_range: [0, 10]


# Render scenes
render_starting_chunk: 0  # If multi_run, should be 0, 10, 20, 30, ..., 1000 if render_n_chunk_to_process=10 & 10000 scenes to render
render_n_chunk_to_process: 200  # i.e.  (render_n_chunk_to_process * chunk_size) scenes to render

scene_renderer:
  train:
    paths:
      hoairs: ${path.root}/clarity_data/train/rooms/HOA_IRs
      hrirs: ${path.root}/clarity_data/hrir/HRIRs_MAT
      scenes: ${path.root}/clarity_data/train/additional_scenes
      targets: ${path.root}/clarity_data/train/targets
      interferers: ${path.root}/clarity_data/train/interferers/{type}
    metadata:
      room_definitions: ${path.metadata_dir}/rooms.train.json
      scene_definitions: ${path.metadata_dir}/scenes.train_additional.json
      hrir_metadata: ${path.metadata_dir}/hrir_data.json
    chunk_size: 10

render_params:
  ambisonic_order: 6
  equalise_loudness: False
  reference_channel: 1
  channel_norms: [12.0, 3.0, 3.0, 3.0]

hydra:
  run:
    dir: .
  job:
    chdir: True

defaults:
  - override hydra/launcher: cec2_submitit_local
Data Generation Details:
Hydra
- Launcher